Dataguide

Operativa regler för konsekvent extraktion och för att pröva rimliga samband i tidsstämplad kontext.

READING GUIDE

What you will find on this page

A quick overview of what Dataguide covers before you read in detail.

Highlights from 4 key sections

Extraktionsprinciper

  • Härled aldrig fakta som inte uttryckligen är skrivna
  • Normalisera enheter/tider/antal samtidigt som ursprunglig intention bevaras
  • Behåll okända värden som null i stället för tvingade antaganden
  • Behandla orsakssamband som något som ska prövas, inte som säkerhet
  • Prioritera tidsankare (t.ex. leverans 14:00) och jämför närliggande händelser inom ett fönster
  • Validera datum/day_number-konsistens före publicering

Pipeline

  1. Generera dagboks-/artikel-markdown
  2. Konvertera till telemetri-JSON (convert_diary_to_json_telemetry_v2.py)
  3. Extrahera semantiska händelser (beteende, miljö, intervention) som tidsankare
  4. Jämför händelser i före/efter-fönster (t.ex. -30 min till +60 min) för att pröva samband
  5. Spara JSON som källdata (posts/telemetry/ja/telemetry_XXXX.json)
  6. Kör daglig delta-synk till SQLite via WP-Cron (01:30)
  7. Återanvänd data i dashboards/FAQ/fasta sidor

Publiceringskvalitetsgrindar

Publiceringsautomationen validerar:

  • titel/textlängd/antal rubriker
  • kvarvarande TODO/TBD-platshållare
  • rimlighet i länkformat
  • konsistens mellan frontmatter.date och telemetry.date
  • täckning för tidsankarextraktion (missade tidsangivelser)
  • länkning av evidensfragment för varje prövat samband

Rapporter lagras i logs/publish_quality_gate.jsonl.

Tidsgranulär Kausal Inferens (Beta)

Använd semantisk matchning för att omvandla vardagskontext och reaktioner till verifierbara samband.

Exempel: “Aktiviteten ökade 14:00” förklarar inte varför i sig. Vi länkar ankare samma dag som “14:00 leverans”, “14:03 skäll” och “14:10 lugn” till en kedja att pröva: leveransstimulus -> aktiveringsreaktion -> återhämtning.

  • Output 1: kandidat-samband (trigger / reaction / recovery)
  • Output 2: evidens (källfragment och tidsdifferenser)
  • Output 3: confidence (high / medium / low)
  • Output 4: nästa insamlingsinstruktion (vad som ska mätas härnäst)

Pröva dessa samband i Prognos och använd dem i Träningsguiden.

Relaterade sidor