一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

世界上最佳且最快的語音轉文字模型現在變得更好了！ @AssemblyAI 剛剛推出了一個重大更新，我對其中一個新功能愛不釋手。 1. 首先，他們現在可以自動識別音頻中說話者的姓名或角色。 2. 您還可以請求以任何語言（目前支持99種語言）獲取文字稿，因此您不必擔心進行額外的翻譯步驟。但我最喜歡的功能無疑是 LLM Gateway，它讓您可以將整個語音堆疊整合到一個平台中。這個網關是一個 API，您可以用於各種與音頻相關的任務。例如，您可以用它來總結通話、提取見解或分類說話者的情感。不再需要多步驟的流程。您只需進行一次呼叫，平台將把請求路由到適當的模型，包括 OpenAI、Gemini 和其他模型。這對於任何在生產應用中使用語音的人來說都是一個重大利好！所有這些都運行在他們已經極快且準確的語音轉文字平台上，並內建了說話者識別和多語言訓練。如果您正在構建語音應用，這將是遊戲規則的改變者。我已經是 Assembly AI 的用戶多年了。他們的模型和 API 都很棒，我很高興他們決定與我合作撰寫這篇文章。您可以通過點擊這裡在他們的遊樂場上試用他們的模型：