Datagids

Operationele regels voor consistente extractie en het toetsen van plausibele verbanden uit tijdgestempelde context.

READING GUIDE

What you will find on this page

A quick overview of what Datagids covers before you read in detail.

Highlights from 4 key sections

Extractieprincipes

  • Leid nooit feiten af die niet expliciet zijn opgeschreven
  • Normaliseer eenheden/tijd/aantallen met behoud van de oorspronkelijke intentie
  • Bewaar onbekende waarden als null in plaats van geforceerde aannames
  • Behandel oorzaak-gevolg als een te toetsen verband, niet als zekerheid
  • Geef prioriteit aan tijdankers (bijv. levering om 14:00) en vergelijk nabije gebeurtenissen binnen een venster
  • Valideer datum/day_number-consistentie voor publicatie

Pipeline

  1. Genereer dagboek-/artikel-markdown
  2. Converteer naar telemetrie-JSON (convert_diary_to_json_telemetry_v2.py)
  3. Extraheer semantische events (gedrag, omgeving, interventie) als tijdankers
  4. Vergelijk events in voor/na-vensters (bijv. -30 min tot +60 min) om verbanden te controleren
  5. Sla JSON op als brondata (posts/telemetry/ja/telemetry_XXXX.json)
  6. Voer dagelijkse delta-sync naar SQLite uit via WP-Cron (1:30)
  7. Hergebruik data in dashboards/FAQ/fixed pages

Publicatie-kwaliteitspoorten

Publicatie-automatisering valideert:

  • titel/tekstreeks/heading-aantal
  • restanten van TODO/TBD-placeholders
  • geldigheid van linkformaat
  • consistentie tussen frontmatter.date en telemetry.date
  • dekking van tijdanker-extractie (gemiste tijdsvermeldingen)
  • koppeling van bewijsfragmenten per gecontroleerd verband

Rapporten worden opgeslagen in logs/publish_quality_gate.jsonl.

Tijdsgranulaire Causale Inferentie (Beta)

Gebruik semantische matching om dagelijkse context en reacties om te zetten in controleerbare verbanden.

Voorbeeld: “Activiteit steeg om 14:00” verklaart op zichzelf niet waarom. We koppelen ankers van dezelfde dag zoals “14:00 levering”, “14:03 blaffen” en “14:10 kalm” tot een keten om te controleren: leveringsprikkel -> arousalreactie -> herstel.

  • Output 1: kandidaat-verband (trigger / reaction / recovery)
  • Output 2: bewijs (bronfragmenten en tijdsverschillen)
  • Output 3: confidence (high / medium / low)
  • Output 4: volgende meetinstructie (wat hierna meten)

Controleer deze verbanden in Voorspelling en werk ze uit in de Trainingsgids.

Gerelateerde pagina's