Datagids
Operationele regels voor consistente extractie en het toetsen van plausibele verbanden uit tijdgestempelde context.
READING GUIDE
What you will find on this page
A quick overview of what Datagids covers before you read in detail.
Extractieprincipes
This section gives a quick overview of Extractieprincipes.
Pipeline
This section gives a quick overview of Pipeline.
Publicatie-kwaliteitspoorten
This section gives a quick overview of Publicatie-kwaliteitspoorten.
Tijdsgranulaire Causale Inferentie (Beta)
Gebruik semantische matching om dagelijkse context en reacties om te zetten in controleerbare verbanden.
Extractieprincipes
- Leid nooit feiten af die niet expliciet zijn opgeschreven
- Normaliseer eenheden/tijd/aantallen met behoud van de oorspronkelijke intentie
- Bewaar onbekende waarden als null in plaats van geforceerde aannames
- Behandel oorzaak-gevolg als een te toetsen verband, niet als zekerheid
- Geef prioriteit aan tijdankers (bijv. levering om 14:00) en vergelijk nabije gebeurtenissen binnen een venster
- Valideer datum/day_number-consistentie voor publicatie
Pipeline
- Genereer dagboek-/artikel-markdown
- Converteer naar telemetrie-JSON (
convert_diary_to_json_telemetry_v2.py) - Extraheer semantische events (gedrag, omgeving, interventie) als tijdankers
- Vergelijk events in voor/na-vensters (bijv. -30 min tot +60 min) om verbanden te controleren
- Sla JSON op als brondata (
posts/telemetry/ja/telemetry_XXXX.json) - Voer dagelijkse delta-sync naar SQLite uit via WP-Cron (1:30)
- Hergebruik data in dashboards/FAQ/fixed pages
Publicatie-kwaliteitspoorten
Publicatie-automatisering valideert:
- titel/tekstreeks/heading-aantal
- restanten van TODO/TBD-placeholders
- geldigheid van linkformaat
- consistentie tussen frontmatter.date en telemetry.date
- dekking van tijdanker-extractie (gemiste tijdsvermeldingen)
- koppeling van bewijsfragmenten per gecontroleerd verband
Rapporten worden opgeslagen in logs/publish_quality_gate.jsonl.
Tijdsgranulaire Causale Inferentie (Beta)
Gebruik semantische matching om dagelijkse context en reacties om te zetten in controleerbare verbanden.
Voorbeeld: “Activiteit steeg om 14:00” verklaart op zichzelf niet waarom. We koppelen ankers van dezelfde dag zoals “14:00 levering”, “14:03 blaffen” en “14:10 kalm” tot een keten om te controleren: leveringsprikkel -> arousalreactie -> herstel.
- Output 1: kandidaat-verband (trigger / reaction / recovery)
- Output 2: bewijs (bronfragmenten en tijdsverschillen)
- Output 3: confidence (high / medium / low)
- Output 4: volgende meetinstructie (wat hierna meten)
Controleer deze verbanden in Voorspelling en werk ze uit in de Trainingsgids.