Lattice AI 회의록 STT 리서치 + 실험 결과

source updated 2026-04-13

Lattice STT 리서치

원본 정보

  • 경로: .claude/archive/2026-03-13_AI회의록/리서치_STT.md, 의사결정_오디오캡처.md
  • 후속: .claude/archive/2026-03-24_AI회의록-STT퍼포먼스리서치/
  • 작성일: 2026-03-09~24

핵심 발견 (wiki-worthy — 기술 제약, stale 가능성 낮음)

  1. 브라우저 스피커 직접 접근 불가getDisplayMedia 필수
  2. OpenAI 실시간+화자구분 동시 불가 → UX 요구사항이 아키텍처 선택을 결정
  3. 합성 녹음의 발화 누락 문제 → 채널 분리로 해결
  4. STT chunk 분할 시 화자 ID 리셋 → 단일 파일 or Overlap 배치

의사결정 기록 (stale 가능 — 참고만)

  • 2026-03: Soniox 선택 (gpt-4o-transcribe-diarize 대비 품질/비용 우세)
  • 2026-03: 실시간 MVP 우선 (화자 구분은 후속), 1분 내 회의록 목표
  • 2026-03: 압축(64kbps mp3) 선택 (chunk 분할 대비 화자 연속성 보장)