Является ли GPT-5 хорошей вехой, чтобы наконец перестать называть все "моделями" и начать различать между чат-ботами, API, весами моделей и соответственно сравнивать/бенчмаркить? Нет смысла сравнивать выводы чат-ботов (которые могут быть результатом десятков различных весов моделей) с выводами одной модели, это все равно что сравнивать машину с двигателем (книга от @random_walker @sayashk)
9,25K