Guida ai dati

Regole operative per mantenere un’estrazione coerente e verificare collegamenti plausibili nei dati con timestamp.

READING GUIDE

What you will find on this page

A quick overview of what Guida ai dati covers before you read in detail.

Highlights from 4 key sections

Principi di estrazione

  • Non inferire mai fatti non esplicitamente scritti
  • Normalizza unità/orari/conteggi preservando l’intento originale
  • Mantieni i valori sconosciuti come null invece di forzare supposizioni
  • Tratta i collegamenti causa-effetto come piste da verificare, non come certezze
  • Dai priorità agli ancoraggi temporali (es. consegna alle 14:00) e confronta gli eventi vicini in una finestra
  • Verifica la coerenza tra date e day_number prima della pubblicazione

Pipeline

  1. Genera markdown di diario/articolo
  2. Converti in JSON di telemetria (convert_diary_to_json_telemetry_v2.py)
  3. Estrai eventi semantici (comportamento, ambiente, intervento) come ancore temporali
  4. Confronta eventi nelle finestre prima/dopo (es. da -30 min a +60 min) per creare collegamenti da verificare
  5. Salva il JSON come dati di origine (posts/telemetry/ja/telemetry_XXXX.json)
  6. Esegui sincronizzazione delta quotidiana su SQLite tramite WP-Cron (1:30)
  7. Riutilizza i dati in dashboard/FAQ/pagine fisse

Controlli qualità di pubblicazione

L’automazione di pubblicazione verifica:

  • lunghezza di titolo/corpo/conteggio intestazioni
  • presenza residua di placeholder TODO/TBD
  • coerenza del formato link
  • coerenza tra frontmatter.date e telemetry.date
  • copertura dell’estrazione degli ancoraggi temporali (menzioni con orario mancanti)
  • collegamento dei frammenti di evidenza per ogni candidato causale

I report sono salvati in logs/publish_quality_gate.jsonl.

Inferenza Causale a Granularità Temporale (Beta)

Usa il matching semantico per trasformare contesto quotidiano e reazioni in collegamenti verificabili.

Esempio: “Attività aumentata alle 14:00” da solo non spiega il motivo. Colleghiamo ancore della stessa giornata come “14:00 consegna”, “14:03 abbaio” e “14:10 calma” per modellare una catena da verificare: stimolo consegna -> risposta di attivazione -> recupero.

  • Output 1: collegamento candidato (trigger / reaction / recovery)
  • Output 2: evidenze (frammenti sorgente e differenze temporali)
  • Output 3: confidenza (high / medium / low)
  • Output 4: istruzione di acquisizione successiva (cosa misurare dopo)

Convalida questi collegamenti nella Previsione e rendili operativi nella Guida all’Addestramento.

Pagine correlate