Dataguide
Operativa regler för konsekvent extraktion och för att pröva rimliga samband i tidsstämplad kontext.
READING GUIDE
What you will find on this page
A quick overview of what Dataguide covers before you read in detail.
Extraktionsprinciper
This section gives a quick overview of Extraktionsprinciper.
Pipeline
This section gives a quick overview of Pipeline.
Publiceringskvalitetsgrindar
This section gives a quick overview of Publiceringskvalitetsgrindar.
Tidsgranulär Kausal Inferens (Beta)
Använd semantisk matchning för att omvandla vardagskontext och reaktioner till verifierbara samband.
Extraktionsprinciper
- Härled aldrig fakta som inte uttryckligen är skrivna
- Normalisera enheter/tider/antal samtidigt som ursprunglig intention bevaras
- Behåll okända värden som null i stället för tvingade antaganden
- Behandla orsakssamband som något som ska prövas, inte som säkerhet
- Prioritera tidsankare (t.ex. leverans 14:00) och jämför närliggande händelser inom ett fönster
- Validera datum/day_number-konsistens före publicering
Pipeline
- Generera dagboks-/artikel-markdown
- Konvertera till telemetri-JSON (
convert_diary_to_json_telemetry_v2.py) - Extrahera semantiska händelser (beteende, miljö, intervention) som tidsankare
- Jämför händelser i före/efter-fönster (t.ex. -30 min till +60 min) för att pröva samband
- Spara JSON som källdata (
posts/telemetry/ja/telemetry_XXXX.json) - Kör daglig delta-synk till SQLite via WP-Cron (01:30)
- Återanvänd data i dashboards/FAQ/fasta sidor
Publiceringskvalitetsgrindar
Publiceringsautomationen validerar:
- titel/textlängd/antal rubriker
- kvarvarande TODO/TBD-platshållare
- rimlighet i länkformat
- konsistens mellan frontmatter.date och telemetry.date
- täckning för tidsankarextraktion (missade tidsangivelser)
- länkning av evidensfragment för varje prövat samband
Rapporter lagras i logs/publish_quality_gate.jsonl.
Tidsgranulär Kausal Inferens (Beta)
Använd semantisk matchning för att omvandla vardagskontext och reaktioner till verifierbara samband.
Exempel: “Aktiviteten ökade 14:00” förklarar inte varför i sig. Vi länkar ankare samma dag som “14:00 leverans”, “14:03 skäll” och “14:10 lugn” till en kedja att pröva: leveransstimulus -> aktiveringsreaktion -> återhämtning.
- Output 1: kandidat-samband (trigger / reaction / recovery)
- Output 2: evidens (källfragment och tidsdifferenser)
- Output 3: confidence (high / medium / low)
- Output 4: nästa insamlingsinstruktion (vad som ska mätas härnäst)
Pröva dessa samband i Prognos och använd dem i Träningsguiden.