Maailman paras ja nopein puheesta tekstiksi -malli on nyt entistä parempi! @AssemblyAI juuri julkaissut valtavan päivityksen, ja olen täysin rakastunut yhteen uusista ominaisuuksista. 1. Ensinnäkin he voivat nyt automaattisesti tunnistaa äänitteessä puhuvan henkilön nimen tai roolin perusteella. 2. Voit myös pyytää transkriptiota millä tahansa kielellä (tähän mennessä tuettu 99 kieltä), joten sinun ei tarvitse huolehtia käännöksen lisävaiheiden suorittamisesta. Mutta suosikkiominaisuuteni on ylivoimaisesti LLM Gateway, jonka avulla voit yhdistää koko äänipinosi yhdelle alustalle. Yhdyskäytävä on API, jota voit käyttää monenlaisiin ääneen liittyviin tehtäviin. Voit käyttää sitä esimerkiksi puhelun yhteenvedon, merkityksellisten tietojen poimimiseen tai puhujan asenteen luokittelemiseen. Monivaiheista putkistoa ei enää tarvita. Voit soittaa yhden puhelun, ja alusta reitittää pyynnön sopivaan malliin, mukaan lukien OpenAI, Gemini ja muut. Tämä on valtava asia kaikille, jotka käyttävät ääntä tuotantosovelluksissa! Kaikki tämä toimii heidän jo ennestään järjettömän nopealla ja tarkalla puheesta tekstiksi -alustallaan, johon on sisällytetty diarisointi ja monikielinen koulutus. Jos rakennat äänellä, tämä on pelin muuttaja. Olen ollut Assembly AI -käyttäjä vuosia. Heidän mallinsa ja API:nsa ovat uskomattomia, ja olen iloinen, että he päättivät tehdä yhteistyötä kanssani tämän postauksen parissa. Voit kokeilla heidän malliaan heidän leikkikentällään klikkaamalla tästä: