데이터 가이드

기록을 읽는 기준과 데이터 관련 페이지의 차이를 정리한 안내입니다.

Last reviewed: 2026-04-10

추출 원칙

  • 명시적으로 적혀 있지 않은 사실을 추론하지 않습니다
  • 원래 의도를 보존하면서 단위/시간/횟수를 정규화합니다
  • 알 수 없는 값은 추정하지 않고 null로 유지합니다
  • 인과관계는 확정이 아니라 검토할 연관성으로 다룹니다
  • 시간 앵커(예: 14:00 배송)를 우선하고 인접 이벤트를 윈도우로 비교합니다
  • 게시 전 date/day_number 일관성을 검증합니다

질문별로 먼저 열어야 할 데이터 페이지

필요한 답의 종류에 따라 첫 페이지를 나눕니다.

보완·추정·재정리 필드를 읽는 기준

나중에 보완되거나 다듬어진 telemetry 를 읽을 때의 짧은 기준입니다.

공개 페이지에는 일기 원문에서 바로 가져온 값과, 나중에 보완되거나 재정리된 필드가 함께 섞여 있습니다. 헷갈릴 때는 먼저 원문에 가까운 항목을 읽고, 파생 값은 보조 맥락으로 사용하세요.

  • 식사, 배변 시각, 이벤트 메모처럼 원문에 가까운 필드를 먼저 읽습니다
  • 태그, 혼자 있었던 시간, 날씨, 일부 파생 지표는 나중에 다듬어질 수 있으므로 보조 맥락으로 읽습니다
  • 추정값은 증거라기보다 다시 확인할 신호로 다룹니다
  • 알 수 없는 값은 그대로 두며, 빈칸을 보여주기 위해 억지로 채우지 않습니다

하루치 일기가 구조화 데이터가 되는 방식

자유로운 일기 문장을 나중에 비교하기 쉬운 단위로 나눠 보관합니다.

하루치 일기는 자유문을 그대로 남기면서도, 비교하기 쉬운 몇 가지 그룹으로 다시 정리합니다.

  • 식사: 아침, 저녁, 총량을 나눠 저장합니다
  • 배변: 성공, 실수, 시각을 분리해 둡니다
  • 건강 이벤트: 양치, 구토, 병원 방문, 사회적 접촉 등을 별도 이벤트로 분리합니다
  • 환경: 날씨, 방문자, 혼자 있던 시간을 같은 날짜에 연결합니다
  • 태그: 나중에 찾기 쉬운 짧은 주제만 남깁니다

게시 품질 게이트

게시 자동화는 다음을 검증합니다.

  • 제목/본문 길이/헤딩 수
  • TODO/TBD 플레이스홀더 잔존
  • 링크 형식의 유효성
  • frontmatter.date와 telemetry.date 일관성
  • 시간 앵커 추출 커버리지(시간 표기 누락)
  • 각 검토 대상 연관성에 증거 조각이 연결되어 있는지

리포트는 logs/publish_quality_gate.jsonl에 저장됩니다.

데이터 질문 다음에 볼 페이지

읽는 기준을 확인한 뒤, 다음 질문에 맞는 페이지로 이동합니다.