Guida ai dati
Regole operative per mantenere un’estrazione coerente e verificare collegamenti plausibili nei dati con timestamp.
READING GUIDE
What you will find on this page
A quick overview of what Guida ai dati covers before you read in detail.
Principi di estrazione
This section gives a quick overview of Principi di estrazione.
Pipeline
This section gives a quick overview of Pipeline.
Controlli qualità di pubblicazione
This section gives a quick overview of Controlli qualità di pubblicazione.
Inferenza Causale a Granularità Temporale (Beta)
Usa il matching semantico per trasformare contesto quotidiano e reazioni in collegamenti verificabili.
Principi di estrazione
- Non inferire mai fatti non esplicitamente scritti
- Normalizza unità/orari/conteggi preservando l’intento originale
- Mantieni i valori sconosciuti come null invece di forzare supposizioni
- Tratta i collegamenti causa-effetto come piste da verificare, non come certezze
- Dai priorità agli ancoraggi temporali (es. consegna alle 14:00) e confronta gli eventi vicini in una finestra
- Verifica la coerenza tra date e day_number prima della pubblicazione
Pipeline
- Genera markdown di diario/articolo
- Converti in JSON di telemetria (
convert_diary_to_json_telemetry_v2.py) - Estrai eventi semantici (comportamento, ambiente, intervento) come ancore temporali
- Confronta eventi nelle finestre prima/dopo (es. da -30 min a +60 min) per creare collegamenti da verificare
- Salva il JSON come dati di origine (
posts/telemetry/ja/telemetry_XXXX.json) - Esegui sincronizzazione delta quotidiana su SQLite tramite WP-Cron (1:30)
- Riutilizza i dati in dashboard/FAQ/pagine fisse
Controlli qualità di pubblicazione
L’automazione di pubblicazione verifica:
- lunghezza di titolo/corpo/conteggio intestazioni
- presenza residua di placeholder TODO/TBD
- coerenza del formato link
- coerenza tra frontmatter.date e telemetry.date
- copertura dell’estrazione degli ancoraggi temporali (menzioni con orario mancanti)
- collegamento dei frammenti di evidenza per ogni candidato causale
I report sono salvati in logs/publish_quality_gate.jsonl.
Inferenza Causale a Granularità Temporale (Beta)
Usa il matching semantico per trasformare contesto quotidiano e reazioni in collegamenti verificabili.
Esempio: “Attività aumentata alle 14:00” da solo non spiega il motivo. Colleghiamo ancore della stessa giornata come “14:00 consegna”, “14:03 abbaio” e “14:10 calma” per modellare una catena da verificare: stimolo consegna -> risposta di attivazione -> recupero.
- Output 1: collegamento candidato (trigger / reaction / recovery)
- Output 2: evidenze (frammenti sorgente e differenze temporali)
- Output 3: confidenza (high / medium / low)
- Output 4: istruzione di acquisizione successiva (cosa misurare dopo)
Convalida questi collegamenti nella Previsione e rendili operativi nella Guida all’Addestramento.