世界上最佳且最快的語音轉文字模型現在變得更好了! @AssemblyAI 剛剛推出了一個重大更新,我對其中一個新功能愛不釋手。 1. 首先,他們現在可以自動識別音頻中說話者的姓名或角色。 2. 您還可以請求以任何語言(目前支持99種語言)獲取文字稿,因此您不必擔心進行額外的翻譯步驟。 但我最喜歡的功能無疑是 LLM Gateway,它讓您可以將整個語音堆疊整合到一個平台中。 這個網關是一個 API,您可以用於各種與音頻相關的任務。例如,您可以用它來總結通話、提取見解或分類說話者的情感。 不再需要多步驟的流程。您只需進行一次呼叫,平台將把請求路由到適當的模型,包括 OpenAI、Gemini 和其他模型。 這對於任何在生產應用中使用語音的人來說都是一個重大利好! 所有這些都運行在他們已經極快且準確的語音轉文字平台上,並內建了說話者識別和多語言訓練。 如果您正在構建語音應用,這將是遊戲規則的改變者。 我已經是 Assembly AI 的用戶多年了。他們的模型和 API 都很棒,我很高興他們決定與我合作撰寫這篇文章。 您可以通過點擊這裡在他們的遊樂場上試用他們的模型: