GPT-5是否是一个好的里程碑,终于可以不再称呼一切为“模型”,而开始区分聊天机器人、API、模型权重,并进行相应的比较/基准测试? 将聊天机器人的输出(可能是数十种不同模型权重的结果)与单一模型权重的输出进行比较毫无意义,这就像将一辆车与一台发动机进行比较(来自@random_walker @sayashk的书).
9.2K