私たちは、Anthropic Fellows プログラムの別のラウンドを実施しています。 コーディングや技術的なバックグラウンドを持つエンジニアや研究者であれば、今年10月からAnthropicから資金提供、コンピューティング、指導を受けるために応募することができます。約32か所あります。
このプログラムは~2か月間実施され、進捗状況とパフォーマンスに基づいてさらに4か月延長される機会があります。 8月17日までに、以下の場所でご参加ください。 -私達: -英国: -カナダ:
フェローは以下にアクセスできます。 - 毎週 2,100 ドルの奨学金。 - コンピューティングおよび研究コストとして月額 ~15 ドル。 - 人類研究者による1対1の指導。 - ベイエリアまたはロンドンの共有ワークスペース。
フェローは、次のような分野で人類の研究者と協力します。 - 敵対的堅牢性とAI制御。 - スケーラブルな監視。 - ミスアライメントのモデル生物。 - メカニズムの解釈可能性。
2) 「サブリミナル学習」、つまり言語モデルが、無意味に見えるデータであっても、その特性を他のモデルに伝達できることを実証する研究:
Anthropic
Anthropic2025年7月23日
Anthropic Fellows Programの一環として@OwainEvans_UKとの共同論文では、サブリミナル学習という驚くべき現象を研究しています。 言語モデルは、無意味に見えるデータであっても、その特性を他のモデルに伝達することができます。
3) テスト時の計算における逆スケーリングのケースの発見 – ますます多くの推論がますます悪い結果につながる:
Aryo Pradipta Gema
Aryo Pradipta Gema2025年7月22日
新しい人類研究:「テスト時計算における逆スケーリング」 推論が長いほど精度が低下するケースが見つかりました。 私たちの調査結果は、テスト時計算のナイーブなスケーリングが、問題のある推論パターンを誤って強化する可能性があることを示唆しています。 🧵
他の組織に所属するフェローからの応募を歓迎します(例:博士課程在学中に参加できます)。 そして最後に、フェローシップはAnthropicでの役割に有利になります:完了したフェローにフルタイムのオファーをいくつか提供する予定です。
276.69K