데이터 가이드
기록을 읽는 기준과 데이터 관련 페이지의 차이를 정리한 안내입니다.
Last reviewed: 2026-04-10
추출 원칙
- 명시적으로 적혀 있지 않은 사실을 추론하지 않습니다
- 원래 의도를 보존하면서 단위/시간/횟수를 정규화합니다
- 알 수 없는 값은 추정하지 않고 null로 유지합니다
- 인과관계는 확정이 아니라 검토할 연관성으로 다룹니다
- 시간 앵커(예: 14:00 배송)를 우선하고 인접 이벤트를 윈도우로 비교합니다
- 게시 전 date/day_number 일관성을 검증합니다
질문별로 먼저 열어야 할 데이터 페이지
필요한 답의 종류에 따라 첫 페이지를 나눕니다.
오늘의 변화인지, 긴 흐름인지, 읽는 기준인지, 기술 사양인지에 따라 보는 페이지가 달라집니다. 어디서 시작할지 모르겠다면 먼저 문제별 체크리스트를 여세요.
보완·추정·재정리 필드를 읽는 기준
나중에 보완되거나 다듬어진 telemetry 를 읽을 때의 짧은 기준입니다.
공개 페이지에는 일기 원문에서 바로 가져온 값과, 나중에 보완되거나 재정리된 필드가 함께 섞여 있습니다. 헷갈릴 때는 먼저 원문에 가까운 항목을 읽고, 파생 값은 보조 맥락으로 사용하세요.
- 식사, 배변 시각, 이벤트 메모처럼 원문에 가까운 필드를 먼저 읽습니다
- 태그, 혼자 있었던 시간, 날씨, 일부 파생 지표는 나중에 다듬어질 수 있으므로 보조 맥락으로 읽습니다
- 추정값은 증거라기보다 다시 확인할 신호로 다룹니다
- 알 수 없는 값은 그대로 두며, 빈칸을 보여주기 위해 억지로 채우지 않습니다
하루치 일기가 구조화 데이터가 되는 방식
자유로운 일기 문장을 나중에 비교하기 쉬운 단위로 나눠 보관합니다.
하루치 일기는 자유문을 그대로 남기면서도, 비교하기 쉬운 몇 가지 그룹으로 다시 정리합니다.
- 식사: 아침, 저녁, 총량을 나눠 저장합니다
- 배변: 성공, 실수, 시각을 분리해 둡니다
- 건강 이벤트: 양치, 구토, 병원 방문, 사회적 접촉 등을 별도 이벤트로 분리합니다
- 환경: 날씨, 방문자, 혼자 있던 시간을 같은 날짜에 연결합니다
- 태그: 나중에 찾기 쉬운 짧은 주제만 남깁니다
게시 품질 게이트
게시 자동화는 다음을 검증합니다.
- 제목/본문 길이/헤딩 수
- TODO/TBD 플레이스홀더 잔존
- 링크 형식의 유효성
- frontmatter.date와 telemetry.date 일관성
- 시간 앵커 추출 커버리지(시간 표기 누락)
- 각 검토 대상 연관성에 증거 조각이 연결되어 있는지
리포트는 logs/publish_quality_gate.jsonl에 저장됩니다.