Skip to content

[작업] meeting-summary-tool STT 실행 옵션과 smoke 검증 경로 추가 #99

@PHJ2000

Description

@PHJ2000

배경

meeting-summary-tool은 이제 CLI에서 전사 -> 요약 -> Markdown 저장까지 최소 end-to-end 흐름이 연결되었습니다.

다만 현재 전사 단계는 transcribe_audio() 내부 기본값에 크게 의존하고 있어서, 실제 사용 시 다음과 같은 공백이 있습니다.

  • STT 모델 크기, 디바이스, compute type을 CLI에서 제어할 수 없음
  • 언어, beam size, VAD 같은 전사 옵션을 실험하기 어려움
  • 실제 오디오 기준 smoke 검증 시 어떤 옵션 조합이 권장되는지 불명확함
  • 전사 실패 시 사용자에게 조정 가능한 포인트를 충분히 안내하지 못함

이제 end-to-end 골격이 붙은 만큼, 실제 STT 실행 제어와 검증 경로를 열어주는 작업이 다음 단계로 자연스럽습니다.

목표

  • CLI에서 핵심 STT 옵션을 명시적으로 받을 수 있게 한다.
  • 파이프라인이 해당 옵션을 전사 단계로 전달하도록 연결한다.
  • 실제 오디오 smoke 실행 시 사용할 기본 조합과 실패 메시지를 정리한다.

작업 항목

  • CLI에 STT 옵션 추가
    • --stt-model
    • --stt-device
    • --stt-compute-type
    • --language
    • --beam-size
    • --vad-filter
  • 파이프라인에서 전사 옵션 전달 구조 추가
  • 실패 시 사용자 메시지 개선
    • 모델 로드 실패
    • 디바이스/compute type 부적합
    • 입력 파일 문제
  • README 또는 문서에 권장 실행 예시 추가
  • smoke 검증 절차 정리

완료 조건

  • 사용자가 CLI에서 STT 옵션을 바꿔 실행할 수 있다.
  • 파이프라인이 옵션을 누락 없이 transcribe_audio()까지 전달한다.
  • 기본 실행 예시와 실패 대응 힌트가 문서에 정리된다.
  • 최소 1회 이상 옵션 포함 실행 경로를 검증한다.

참고

  • 현재 STT 구현: meeting-summary-tool/src/meeting_summary_tool/stt/transcribe.py
  • 현재 파이프라인 구현: meeting-summary-tool/src/meeting_summary_tool/pipeline.py
  • 현재 CLI 진입점: meeting-summary-tool/src/meeting_summary_tool/cli.py

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions