デンマークの医療AI企業Cortiは、臨床グレードの音声認識モデル「Symphony for Speech-to-Text」を提供開始しました。リアルタイムの口述筆記、会話型の文字起こし、バッチ処理に対応することを目的に、臨床業務向けに設計されています。
Cortiは新たに公開した研究論文で、一般的な音声モデルやAPIと比べて医療専門用語でのワード誤り率(WER)を最大93%削減したとしています。英語の医療専門用語ではWERが1.4%で、OpenAIは17.7%、ElevenLabsは18.1%、Whisperは17.4%、Parakeetは18.9%でした。
さらに、整形済みの臨床エンティティ(投与量、測定値、日付など)のリコールは98.3%に達したと報告し、強い汎用ベースラインは44.3%でした。
既存の専用医療書記システムであるDragon Medical Oneとも比較し、現実の英語口述でCortiはWER 4.6%とし、Dragonの5.7%を上回りました。
CortiはSymphony for Speech-to-TextをCorti APIのエンドポイントとして一般提供し、統合用の技術ドキュメントも公開しています。誤認識が医療判断や下流のAI処理の信頼性を損なうため、正確な「音声の基礎データ層」が重要だと説明しました。
参照元:2026/05/20 「Corti’s new Symphony for Speech-to-Text model beats OpenAI at medical terminology accuracy, highlighting the value of specialized AI」 https://venturebeat.com/technology/cortis-new-symphony-for-speech-to-text-model-beats-openai-at-medical-terminology-accuracy-highlighting-the-value-of-specialized-ai
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント