În 2021, am scris despre unde credeam că se îndreaptă recunoașterea vorbirii până în deceniul 2030. Până acum @argmax transformă 2/5 din predicții în realitate (pe dispozitiv și personalizare). Încă cred cu tărie în context și personalizare, nu doar pentru speech-to-text, ci și pentru LLM-uri / alte modalități.
argmax
argmax23 oct., 01:01
Introducerea vocabularului personalizat în Argmax Pro SDK Personalizați vorbirea în text cu cuvinte cheie contextuale în timpul execuției pentru a depăși acuratețea modelelor generice de vorbire de frontieră! Îl puteți încerca pe @superwhisperapp și @argmax Playground astăzi. Mai multe demonstrații și detalii în comentarii.
Extrase relevante și link către postare
14,71K