Machine Learning/News

Whisper - OpenAI가 오픈소스로 공개한 다국어 음성 인식 시스템(ASR)

Physicist 2022. 9. 26. 11:44

https://news.hada.io/topic?id=7458 

 

https://openai.com/blog/whisper/

영어 음성 인식에 대해서는 인간 수준의 정확도에 도달
68만 시간 분량의 다국어 데이터로 훈련
크고 다양한 데이터 셋을 통해 악센트, 배경 소음 및 기술 언어등에 대해서도 견고성(robustness)을 개선