gpt-oss ist ein Werkzeug zur Verarbeitung / Denkmaschine. Eine Art hartes Open-Model, das schwer zu verwenden ist. Meiner Meinung nach wird die Anziehungskraft begrenzt sein. Der beste Weg, um Anziehungskraft zu gewinnen, besteht darin, Modelle zu veröffentlichen, die flexibel, einfach zu verwenden ohne Werkzeuge und zuverlässig sind. Dann können später maßgeschneiderte interessante Modelle wie die Nutzung von Werkzeugen folgen.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)12. Aug., 16:04
gpt-oss 120B hat auf lmarena stark nachgelassen, es verliert gegen Qwen 30B-3AB *instruct* (nicht denken) in jeder Kategorie (außer ≈Unentschieden in Mathe), ganz zu schweigen von seiner Gewichtsklasse und der Kategorie Peer glm-4.5 air. Ich verstehe nicht, wie das passieren kann.
22,68K