データガイド

人が書いた日記を、再利用可能なテレメトリに整えるための処理手順と品質基準。

READING GUIDE

このページでわかること

データガイドの内容を、最初にざっと見渡せるように整理しました。

主要4セクションの要点

ガイドの目的を押さえる

記録を判断に使えるデータへ変換し、運用で活用します。

記録は、人が書いた日記を起点に、次の判断に使える形へ整えて初めて価値が出ます。

  • 個体基準で比較: 品種平均より、どりー自身の過去データとの比較を優先します。
  • 条件を分けて読む: 食事・環境・行動の前後関係を分離して確認します。
  • 予測は検証前提: AI出力は仮説として保持し、後日の実測で更新します。

公開前の保護条件を満たす

公開前に3つの保護処理とチェックを行い、条件を満たしたデータのみを登録します。

PII匿名化(テキスト)

辞書とAIで固有名詞を一般的な表現に置き換え、意味を保ったまま特定につながる情報を除去します。

Hybrid Vision AI(映像)

人物の候補を自動検出し、文脈を再確認してモザイク処理します。どりー本人は見分けられる状態を維持します。

Audio Scrubbing(音声)

動画の会話音や生活音は原則除去し、音声経由の情報流出リスクを抑えます。

抽出ルールを守る

解釈のぶれを抑え、再利用できる品質基準を維持します。

  • 書かれていない事実は補完しない
  • 単位・時刻・回数は元テキスト優先で正規化する
  • 不明な値は「未確定」として保持する
  • 因果は断定せず、候補と確からしさで扱う
  • 時刻アンカーを優先し、前後イベントを比較する
  • 日付・日数番号・記録データの整合を公開前に検査する

処理フローを実行する

入力から公開反映までの4段階を、人の確認を挟みながら同じ手順で回します。

人が日記を書いたあと、保護処理・構造化・確認工程が順番に進みます
01

記録する

毎日の出来事を人が日記に残し、原文を起点にする。

日記原文の記録
02

守る

文脈を保持したまま固有名詞を匿名化する。

匿名化処理
03

構造化する

Markdown下書きと時刻・行動・数値を JSON に整える。

下書き生成と構造化データ変換
04

確認して反映する

自動検査の結果を人が見直し、必要な修正後に公開へ反映する。

人の確認と指標反映

公開前チェックを通す

自動検査に人の目視確認を重ね、品質を担保します。

公開前に、整合性と未確定要素を対象に自動検査を実施し、その結果を人が目視で確認して修正を加えます。

  • タイトル・本文長・見出し数
  • TODO/TBD など未確定文言の残存
  • リンク形式の妥当性
  • 記事の日付とデータの日付の整合
  • 時刻アンカー抽出の取りこぼし
  • 因果候補と根拠断片の紐付け

因果候補を検証する(β)

生活文脈と反応を時刻で結び、あとから検証できる候補として提示します。

同日の時刻アンカーを結び、刺激 → 反応 → 回復 を検証可能な候補として整理します。

  • 出力1: 候補因果(trigger / reaction / recovery)
  • 出力2: 根拠(原文断片と時刻差)
  • 出力3: 確度(high / medium / low)
    high=時刻と根拠が十分、medium=一部根拠あり、low=仮説段階
  • 出力4: 追加で取るべき記録項目

候補は 予測ダッシュボード で優先度を見直し、トレーニングガイド で実行手順に落とし込みます。

関連ページで深掘りする

最終更新: 2026-03-28