كنت متحمسا للانضمام إلى الكلمة الرئيسية الصباحية ل PyTorchCon. الكثير من المناقشات الممتعة: RL هي واحدة من أكثر الحدود الواعدة لأنها تتفوق على التعلم المقلد لأنها تتعلم الأهداف وليس العروض التوضيحية ، وتكتشف استراتيجيات تتجاوز بيانات التدريب التي لا يمكن للتعلم الخاضع للإشراف الوصول إليها ، مثل آثار التفكير الناشئة ل o1. لكن التدريب المسبق لم يمت. تعد الاختراقات المعمارية مثل نماذج الانتشار للترميز و DeltaNet التي تعمل على تحسين أداء الذاكرة الترابطية حدودا واعدة. فلسفتي هي دعم المؤسسين الجريئين الذين يبنون على الحدود ، على سبيل المثال ، بناء Voyage الذكاء الاصطناعي لتضمينات ناقلات قبل سنوات من انطلاق البحث عن الذكاء الاصطناعي للمؤسسات.