gpt-oss — это инструмент, который является только движком обработки / рассуждения. Это своего рода сложная открытая модель для использования. На мой взгляд, интерес к ней будет ограничен. Лучший способ привлечь внимание — выпустить модели, которые гибкие, простые в использовании без инструментов и надежные. Затем, позже, можно создать интересные модели на заказ, такие как использование инструментов.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)12 авг., 16:04
gpt-oss 120B сильно проиграл на lmarena, он уступает Qwen 30B-3AB *instruct* (не думая) в каждой категории (за исключением ≈ничьей в математике), не говоря уже о его весовой категории и сопернике glm-4.5 air. Я не понимаю, как это может происходить.
22,68K