Guide des données
Règles opérationnelles pour une extraction de données cohérente et peu biaisée.
READING GUIDE
What you will find on this page
A quick overview of what Guide des données covers before you read in detail.
Principes d'extraction
- Ne jamais inférer des faits qui ne sont pas explicitement écrits
- Normaliser les unités/l'heure/les comptages en préservant l'intention originale
- Conserver les valeurs inconnues comme null plutôt que des suppositions forcées
- Valider la cohérence date/day_number avant publication
Pipeline
- Générer le markdown du journal/article
- Convertir en JSON de télémétrie (
convert_diary_to_json_telemetry_v2.py) - Conserver le JSON comme données sources (
posts/telemetry/ja/telemetry_XXXX.json) - Synchronisation delta quotidienne avec SQLite via WP-Cron (1h30)
- Réutiliser les données dans les tableaux de bord/FAQ/pages fixes
Contrôles qualité à la publication
L'automatisation de publication valide :
- longueur du titre/corps/nombre de titres
- fuites de marqueurs TODO/TBD
- cohérence du format des liens
- cohérence frontmatter.date vs telemetry.date
Les rapports sont stockés dans logs/publish_quality_gate.jsonl.