今天的SotA AI模型为普通知识工作者提供了20%的生产力提升。 到2030年,普通工人在AI的帮助下,生产力可能提高12倍。 我仍然认为人们低估了进步的速度。
今天的AI系统在一般目的任务(如律师、投资银行家或顾问所做的任务)中仍然容易出错。虽然在纠正错误的时间上有所适应,但它们对工人的提升微乎其微(并且对初始条件敏感)。
Apex基准提供了一个框架,通过它我们可以判断AI模型的性能,并对它们在这些通用任务上的改进有一个大致的了解。 今天,最好的模型在基准测试中的得分刚刚超过60%。到2030年,最先进的技术应该能达到95%以上。
17.77K