Guide des données

Règles opérationnelles pour une extraction de données cohérente et peu biaisée.

READING GUIDE

What you will find on this page

A quick overview of what Guide des données covers before you read in detail.

Highlights from 3 key sections

Principes d'extraction

  • Ne jamais inférer des faits qui ne sont pas explicitement écrits
  • Normaliser les unités/l'heure/les comptages en préservant l'intention originale
  • Conserver les valeurs inconnues comme null plutôt que des suppositions forcées
  • Valider la cohérence date/day_number avant publication

Pipeline

  1. Générer le markdown du journal/article
  2. Convertir en JSON de télémétrie (convert_diary_to_json_telemetry_v2.py)
  3. Conserver le JSON comme données sources (posts/telemetry/ja/telemetry_XXXX.json)
  4. Synchronisation delta quotidienne avec SQLite via WP-Cron (1h30)
  5. Réutiliser les données dans les tableaux de bord/FAQ/pages fixes

Contrôles qualité à la publication

L'automatisation de publication valide :

  • longueur du titre/corps/nombre de titres
  • fuites de marqueurs TODO/TBD
  • cohérence du format des liens
  • cohérence frontmatter.date vs telemetry.date

Les rapports sont stockés dans logs/publish_quality_gate.jsonl.

Pages connexes