Guida ai dati | tinywag

Principi di estrazione

This section gives a quick overview of Principi di estrazione.

Pipeline

This section gives a quick overview of Pipeline.

Controlli qualità di pubblicazione

This section gives a quick overview of Controlli qualità di pubblicazione.

Inferenza Causale a Granularità Temporale (Beta)

Usa il matching semantico per trasformare contesto quotidiano e reazioni in collegamenti verificabili.

Principi di estrazione

Non inferire mai fatti non esplicitamente scritti
Normalizza unità/orari/conteggi preservando l’intento originale
Mantieni i valori sconosciuti come null invece di forzare supposizioni
Tratta i collegamenti causa-effetto come piste da verificare, non come certezze
Dai priorità agli ancoraggi temporali (es. consegna alle 14:00) e confronta gli eventi vicini in una finestra
Verifica la coerenza tra date e day_number prima della pubblicazione

Pipeline

Genera markdown di diario/articolo
Converti in JSON di telemetria (convert_diary_to_json_telemetry_v2.py)
Estrai eventi semantici (comportamento, ambiente, intervento) come ancore temporali
Confronta eventi nelle finestre prima/dopo (es. da -30 min a +60 min) per creare collegamenti da verificare
Salva il JSON come dati di origine (posts/telemetry/ja/telemetry_XXXX.json)
Esegui sincronizzazione delta quotidiana su SQLite tramite WP-Cron (1:30)
Riutilizza i dati in dashboard/FAQ/pagine fisse

Controlli qualità di pubblicazione

L’automazione di pubblicazione verifica:

lunghezza di titolo/corpo/conteggio intestazioni
presenza residua di placeholder TODO/TBD
coerenza del formato link
coerenza tra frontmatter.date e telemetry.date
copertura dell’estrazione degli ancoraggi temporali (menzioni con orario mancanti)
collegamento dei frammenti di evidenza per ogni candidato causale

I report sono salvati in logs/publish_quality_gate.jsonl.

Inferenza Causale a Granularità Temporale (Beta)

Usa il matching semantico per trasformare contesto quotidiano e reazioni in collegamenti verificabili.

Esempio: “Attività aumentata alle 14:00” da solo non spiega il motivo. Colleghiamo ancore della stessa giornata come “14:00 consegna”, “14:03 abbaio” e “14:10 calma” per modellare una catena da verificare: stimolo consegna -> risposta di attivazione -> recupero.