"اضغط 1 للغة الإنجليزية أو ابق في الخط" يحتضر ، وأنا أحتفل! كارتيزيا تجعل العوامل الروبوتية عفا عليها الزمن.
لقد قمت بتجميع عرض توضيحي سريع لكيفية إنشاء مساعد صوتي باستخدام مجموعة التكنولوجيا التالية:
• Python - لغة البرمجة
• LiveKit - الوكيل الذي ينسق كل شيء
• كارتيزيا - يحول النص إلى كلام (الصوت الذي تسمعه)
• OpenAI - يحول صوتك إلى نص
• GPT4o-mini - أدمغة الوكيل
65 سطرا من التعليمات البرمجية ، عد المسافات البيضاء.
كود المصدر أدناه. ستجد إرشادات حول كيفية تشغيله في الملف.
طراز MiniMax M2 مذهل!
إنه مفتوح المصدر. يتفوق على Gemini 2.5 و Claude 4.1 و Qwen3 عبر معايير الترميز واستخدام الأدوات.
في الوقت الحالي ، إنها واحدة من أفضل 5 نماذج في العالم في الذكاء!
وهنا هو أفضل جزء:
كلود هو أحد أفضل الموديلات التي يمكنك استخدامها اليوم ، ويكلف MiniMax M2 8٪ فقط من ذلك!
إنه أصغر وأسرع وأرخص. فعال للغاية في استخدام الرموز المميزة.
أكبر قوة ل Minimax M2: قدرات عاملة عالية. يمكن للنموذج تخطيط وتنفيذ مهام سير عمل معقدة متعددة الأدوات. إنه موثوق به وقوي للغاية في تنفيذ سلاسل الأدوات طويلة الأفق.
باختصار:
• زمن انتقال منخفض
• رخيصة جدا
• يتفوق في المهام الوكلاء
• مفتوح المصدر
يعمل الطراز حاليا على تشغيل عامل MiniMax وهو متاح لإصدار تجريبي عالمي مجاني.
يمكنك الوصول إلى واجهة برمجة تطبيقات MiniMax M2 هنا:
للوصول إلى الوكيل:
وهنا موقع MiniMax:
شكرا لفريق MiniMax لإظهار الحبال لي والشراكة معي في هذا المنشور.
هذا هو النموذج الأكثر جنونا الذي ستراه هذا الأسبوع!
هذا النموذج يشغل Figma. كما أنها وراء Wayfair ومجموعة من تجار التجزئة الرئيسيين للتجارة الإلكترونية.
هذا النموذج هو نموذج تحرير صور PIXEL-PERFECT.
حرفيا ، "بكسل مثالي".
النموذج قادر على تعديل صورة واحدة مع الحفاظ على كل شيء آخر كما هو.
إنه نموذج صممه وطوره ونشره فريق البحث في جاسبر.
هذا يتفوق على نماذج OpenAI و Nano Banana وكل نموذج صور عام رأيته حتى الآن. إنه أقل تكلفة بنسبة تصل إلى 100 مرة ، وأسرع حتى 10 مرات.
لقد سجلت مقطع فيديو سريعا لأوضح لك مدى إعجاب ذلك.
هناك الكثير من الأبحاث وراء هذا النموذج. أقوم بإضافة رابطين أدناه حتى تتمكن من القراءة عن كيفية عمل هذا النموذج ، وتحديدا حول "مطابقة الجسر الكامن" و "انتشار الفلاش".