Datenleitfaden

Betriebliche Regeln für konsistente, verzerrungsarme Datenextraktion.

READING GUIDE

What you will find on this page

A quick overview of what Datenleitfaden covers before you read in detail.

Highlights from 3 key sections

Extraktionsprinzipien

  • Niemals Fakten ableiten, die nicht explizit geschrieben sind
  • Einheiten/Zeit/Anzahl normalisieren, dabei die ursprüngliche Absicht bewahren
  • Unbekannte Werte als null belassen statt erzwungene Annahmen
  • Datum/day_number-Konsistenz vor Veröffentlichung validieren

Pipeline

  1. Tagebuch/Artikel-Markdown generieren
  2. In Telemetrie-JSON umwandeln (convert_diary_to_json_telemetry_v2.py)
  3. JSON als Ausgangsdaten speichern (posts/telemetry/ja/telemetry_XXXX.json)
  4. Tägliche Delta-Synchronisierung mit SQLite über WP-Cron (1:30 Uhr)
  5. Daten in Dashboards/FAQ/Festseiten wiederverwenden

Veröffentlichungs-Qualitätsgates

Die Veröffentlichungsautomatisierung prüft:

  • Titel/Textlänge/Überschriftenanzahl
  • TODO/TBD-Platzhalter-Lecks
  • Link-Format-Plausibilität
  • Konsistenz von frontmatter.date und telemetry.date

Berichte werden in logs/publish_quality_gate.jsonl gespeichert.

Verwandte Seiten