熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
世界上最佳且最快的語音轉文字模型現在變得更好了!
@AssemblyAI 剛剛推出了一個重大更新,我對其中一個新功能愛不釋手。
1. 首先,他們現在可以自動識別音頻中說話者的姓名或角色。
2. 您還可以請求以任何語言(目前支持99種語言)獲取文字稿,因此您不必擔心進行額外的翻譯步驟。
但我最喜歡的功能無疑是 LLM Gateway,它讓您可以將整個語音堆疊整合到一個平台中。
這個網關是一個 API,您可以用於各種與音頻相關的任務。例如,您可以用它來總結通話、提取見解或分類說話者的情感。
不再需要多步驟的流程。您只需進行一次呼叫,平台將把請求路由到適當的模型,包括 OpenAI、Gemini 和其他模型。
這對於任何在生產應用中使用語音的人來說都是一個重大利好!
所有這些都運行在他們已經極快且準確的語音轉文字平台上,並內建了說話者識別和多語言訓練。
如果您正在構建語音應用,這將是遊戲規則的改變者。
我已經是 Assembly AI 的用戶多年了。他們的模型和 API 都很棒,我很高興他們決定與我合作撰寫這篇文章。
您可以通過點擊這裡在他們的遊樂場上試用他們的模型:
熱門
排行
收藏

