En 2021, escribí sobre hacia dónde pensaba que iba el reconocimiento de voz hasta la década de 2030. Hasta ahora@argmax está haciendo realidad 2/5 de las predicciones (en el dispositivo y personalización). Todavía creo firmemente en el contexto y la personalización, no solo para la conversión de voz a texto, sino también para los LLM / otras modalidades.
argmax
argmax23 oct, 01:01
Introducción al vocabulario personalizado en el SDK de Argmax Pro Personalice la conversión de voz a texto con palabras clave contextuales en tiempo de ejecución para superar la precisión de los modelos de voz genéricos de frontera. Puedes probarlo en @superwhisperapp y @argmax Playground hoy. Más demostraciones y detalles en los comentarios.
Extractos relevantes y enlace a la publicación
14.63K