Im Jahr 2021 schrieb ich darüber, wohin ich die Sprach­erkennung bis zum Jahrzehnt 2030 für wahrscheinlich hielt. Bisher macht @argmax 2/5 der Vorhersagen zur Realität (Geräte­interne Verarbeitung und Personalisierung). Ich glaube weiterhin fest an Kontext und Personalisierung, nicht nur für Sprach-zu-Text, sondern auch für LLMs / andere Modalitäten.
argmax
argmax23. Okt., 01:01
Einführung des benutzerdefinierten Vokabulars im Argmax Pro SDK Passen Sie die Spracherkennung mit kontextuellen Schlüsselwörtern zur Laufzeit an, um die Genauigkeit generischer Sprachmodelle zu übertreffen! Sie können es heute auf @superwhisperapp und @argmax Playground ausprobieren. Weitere Demos und Details in den Kommentaren.
Relevante Auszüge und Link zum Beitrag
14,69K