파이썬 OpenAI API whisper 사용하기 - 음성 데이터를 텍스트 스크립트로 변환(Speech to Text model)
OpenAI에는 Whisper라는 강력한 Audio to Text 프로그램이 있습니다. 어떻게 만든 건지는 알 수 없지만 음성을 텍스트로 추출하는 기술은 구글의 유튜브 자동 자막보다 뛰어나다는 것이 체감이 됩니다. 특히 한글 인식에 있어서는 지금까지 본적없는 인식률이 아닌가 - 봅니다. 네이버의 클로바노트가 있지만 사용 시간 제한이 있는데 좀 짭니다. 반면 Whisper는 OpenAI의 API로 사용할 수 있는데 그래도 가격이 $0.006 / minute 으로 매우 저렴한 편입니다. (1분에 10원 정도 나간다) 그리고 Whisper는 Open Source로 본인의 PC에 설치해서 사용하면 무료입니다. 여러가지 장점들로 향후 발전 가능성이 매우 높은 AI 모델입니다. 98개의 언어를 훈련시켰으나 에러율을..