Я был рад присоединиться к утреннему ключевому докладу на PyTorchCon. Много интересных обсуждений: RL является одной из самых многообещающих областей, потому что он превосходит имитационное обучение, так как учит цели, а не демонстрации, открывая стратегии, недоступные для обучающих данных, которые не может достичь контролируемое обучение, такие как возникающие следы рассуждений o1. Но предобучение не мертво. Архитектурные прорывы, такие как диффузионные модели для кодирования и DeltaNet, улучшающий производительность ассоциативной памяти, являются многообещающими направлениями. Моя философия заключается в поддержке смелых основателей, которые строят на переднем крае, например, Voyage AI, создающий векторные эмбеддинги за годы до того, как корпоративный AI-поиск стал популярным.