我们正在进行另一轮Anthropic Fellows项目。 如果你是一名具有强大编码或技术背景的工程师或研究人员,你可以申请获得Anthropic的资金、计算资源和指导,从今年十月开始。将会有大约32个名额。
该项目将运行约两个月,基于进展和表现有机会延长四个月。 请在8月17日前申请,加入我们在以下地点的活动: - 美国: - 英国: - 加拿大:
参与者将获得: - 每周津贴 $2,100; - 每月约 $15,000 用于计算和研究费用; - 来自 Anthropic 研究员的一对一指导; - 在湾区或伦敦的共享工作空间。
研究员将与Anthropic的研究人员在以下领域进行合作: - 对抗鲁棒性与AI控制; - 可扩展的监督; - 错位模型生物; - 机制可解释性。
2) 工作展示“潜意识学习”——语言模型可以将其特征传递给其他模型,即使在看似无意义的数据中:
Anthropic
Anthropic2025年7月23日
在与 @OwainEvans_UK 合作的论文中,作为 Anthropic Fellows Program 的一部分,我们研究了一个令人惊讶的现象:潜意识学习。 语言模型可以将其特征传递给其他模型,即使在看似无意义的数据中。
3) 在测试时计算中发现逆缩放的案例——越来越多的推理导致越来越糟糕的结果:
Aryo Pradipta Gema
Aryo Pradipta Gema2025年7月22日
新的Anthropic研究: “测试时间计算中的逆向缩放” 我们发现,在某些情况下,较长的推理导致较低的准确性。 我们的发现表明,测试时间计算的简单缩放可能无意中强化了有问题的推理模式。 🧵
我们很高兴收到与其他组织相关的研究员的申请(例如,您可以在攻读博士学位期间参与)。 最后,获得奖学金将为您在Anthropic的职位打下良好的基础:我们计划向完成奖学金的研究员提供一些全职工作机会。
276.68K