我們正在進行另一輪的Anthropic Fellows計劃。 如果你是一位擁有強大編程或技術背景的工程師或研究人員,你可以申請獲得來自Anthropic的資金、計算資源和指導,從今年十月開始。將會有大約32個名額。
該計劃將運行約兩個月,根據進展和表現有機會延長四個月。 請在8月17日之前申請,加入我們在以下地點的活動: - 美國: - 英國: - 加拿大:
參與者將獲得以下資源: - 每週津貼 $2,100; - 每月約 $15,000 用於計算和研究費用; - 來自 Anthropic 研究員的一對一指導; - 在灣區或倫敦的共享工作空間。
研究人員將與Anthropic的研究人員在以下領域進行合作: - 對抗性穩健性與AI控制; - 可擴展的監督; - 錯位模型生物; - 機械解釋性。
2) 工作展示「潛意識學習」——語言模型可以將其特徵傳遞給其他模型,即使在看似無意義的數據中:
Anthropic
Anthropic2025年7月23日
在與 @OwainEvans_UK 共同撰寫的論文中,作為 Anthropic Fellows Program 的一部分,我們研究了一個驚人的現象:潛意識學習。 語言模型可以將其特徵傳遞給其他模型,即使在看似無意義的數據中。
3) 在測試時計算中尋找反向縮放的案例——越多的推理導致越差的結果:
Aryo Pradipta Gema
Aryo Pradipta Gema2025年7月22日
新的Anthropic研究: “測試時間計算中的反向縮放” 我們發現,較長的推理會導致較低的準確性。 我們的研究結果表明,天真的測試時間計算縮放可能無意中加強了有問題的推理模式。 🧵
我們很高興收到來自其他組織的研究員的申請(例如,您可以在攻讀博士學位期間參加)。 最後,獲得獎學金將對您在Anthropic的角色大有裨益:我們計劃向完成獎學金的研究員提供一些全職工作機會。
276.68K