أفضل وأسرع نموذج تحويل الكلام إلى نص في العالم أصبح أفضل!
@AssemblyAI أسقطت للتو تحديثا ضخما ، وأنا أحب تماما إحدى الميزات الجديدة.
1. أولا ، يمكنهم الآن تحديد الشخص الذي يتحدث بصوت بالاسم أو الدور تلقائيا.
2. يمكنك أيضا طلب نسخة بأي لغة (99 لغة مدعومة حتى الآن) ، لذلك لا داعي للقلق بشأن تشغيل خطوات إضافية للترجمة.
لكن الميزة المفضلة لدي ، إلى حد بعيد ، هي LLM Gateway ، والتي تتيح لك دمج مجموعة الصوت بالكامل في نظام أساسي واحد.
البوابة عبارة عن واجهة برمجة تطبيقات يمكنك استخدامها لمجموعة واسعة من المهام المتعلقة بالصوت. على سبيل المثال ، يمكنك استخدامه لتلخيص مكالمة أو استخراج رؤى أو تصنيف مشاعر المتحدث.
لا حاجة لخط أنابيب متعدد الخطوات بعد الآن. يمكنك إجراء مكالمة واحدة ، وسيقوم النظام الأساسي بتوجيه الطلب إلى النموذج المناسب ، بما في ذلك OpenAI و Gemini وغيرها.
هذا ضخم لأي شخص يستخدم الصوت في تطبيقات الإنتاج!
كل هذا يعمل على منصة تحويل الكلام إلى نص سريعة ودقيقة بالفعل ، مع يوميات وتدريب متعدد اللغات.
إذا كنت تبني بالصوت ، فهذا يغير قواعد اللعبة.
لقد كنت مستخدما ل الذكاء الاصطناعي التجميع لسنوات. نماذجهم وواجهات برمجة التطبيقات الخاصة بهم مذهلة ، وأنا سعيد لأنهم قرروا التعاون معي في هذا المنشور.
يمكنك تجربة نموذجهم في ملعبهم بالنقر هنا:
إنه مستيقظ. تتم إعادة كتابة الطريقة التي تتفاعل بها مع الويب والمعلومات والخدمات.
نقدم لك FlowithOS - أول نظام تشغيل في العالم تم تصميمه أصلا لوكلاء الذكاء الاصطناعي. التطور الذاتي. مدعوم بالذاكرة. سريع البرق.
بالإضافة إلى أي متصفح ذكاء اصطناعي ، فإن أذكى نظام تشغيل وكيل يحول متصفحك إلى قيمة حقيقية ، من مساعدتك إلى التصرف نيابة عنك.
دعونا نشهد معا ⬇️
أريد أن أساعد كل مطور على أن يصبح أفضل من حيث الحجم في هندسة الذكاء الاصطناعي / التعلم الآلي.
فيما يلي الموضوعات التي سأغطيها في مجموعتي القادمة.
نبدأ الأسبوع المقبل (3 نوفمبر)
• 20+ ساعة من الفصول الحية
• الممارسة العملية مع تنفيذ نظام شامل
• أدوات مفتوحة المصدر
• البناء مرة واحدة ، والنشر في أي مكان
طلاب من Google و AWS و Netflix وغيرها من الشركات الكبرى. أكثر من 3,000 خريج.
أفضل برنامج هندسي عبر الإنترنت.