本周在复杂系统节目中,我很高兴欢迎METR的@joel_bkr,讨论我们如何严格测量大型语言模型(LLMs)的进展,Joel和团队最近取得的一个有趣研究结果,以及关于软件工程的工业组织的一点点内容。
15.87K