トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tim Dettmers
Tim Dettmers reposted
DeepConf の紹介: 自信を持って深く考える
🚀 オープンソースモデルでAIME 2025で99.9%を達成する最初の方法!ツールがなくてもGPT-OSS-120Bを使用すると、生成されたトークンを最大85%節約しながら、このほぼ完璧な精度に到達しました。
また、並列思考にも多くの強力な利点があります。
🔥 パフォーマンスの向上:モデルとデータセット全体で~10%の精度
⚡ 超効率:生成されるトークンを最大85%削減
🔧 プラグ&プレイ:既存のモデルで動作します-トレーニングは不要です(ハイパーパラメータのチューニングも不要です!
⭐ デプロイが簡単: vLLM のコードはわずか ~50 行です (以下の PR を参照)
📚 紙:
🌐 プロジェクト:
共同研究:@FuYichao123、xuewei_wang、@tydsh
(詳細は以下のコメントをご覧ください)
408.65K
Tim Dettmers reposted
KV キャッシュの再物質化によって LLM 推論のメモリ壁を打破できますか?
🚨 あまり活用されていないコンピューティングユニットを活用して、LLM推論のメモリボトルネックを解消するXQuantをご紹介します!
• FP16 比で 10 倍から 12.5 倍のメモリ節約
- ほぼゼロの精度損失
• 最先端のKV量子化🔥を上回る
主な洞察:
1. KV キャッシュ = ボトルネック →コンテキスト長 + バッチ サイズで直線的に増加します。
2. メモリ>>コンピューティング → GPU は、メモリ帯域幅よりも桁違いに高速な FLOP を提供します。
3. KVを保存せず、再計算するだけ→重要なアイデアです。🧠
LLM 推論は通常、メモリ帯域幅にバインドされるため、コンピューティング ユニットはアイドル状態になり、十分に活用されていないことがよくあります。したがって、この利用可能なコンピューティングをオーバーヘッドなしで使用できます。
GPU ハードウェアの傾向は、コンピューティング機能がメモリ帯域幅よりもはるかに速く拡張されていることを示しています。したがって、より多くの計算と引き換えにメモリ操作を減らすことは、LLM 推論の高速化に役立ちます。KV キャッシュはシーケンス長とバッチ サイズに応じて直線的に増加し、LLM 推論中にメモリ操作の大部分が発生します。KV キャッシュの読み込みと保存を回避するために追加の計算を交換できれば、推論を高速化できます。
XQuantは、このハードウェアの傾向を利用しています: 🧵 [1/7]
紙:
共同作業:@FuriosaAI @HaochengXiUCB @rish2k1の@coleman_hooper1 @mjlee_official @FuriosaAI @lucamanolache0マイケル・マホニーのカン・ウォンジュン@KurtKeutzer @amir__gholami

32.43K
私の見解では、SWE-bench と T-bench は、モデルがどれだけ進歩したかという点で良いシグナルを持つ数少ないベンチマークです。このモデルは Qwen3 Coder と同等のパフォーマンスを発揮し、GPT-5 よりも 10% しか劣らず、コードに特化したものではなく汎用 LLM でもあります。

Z.ai8月11日 11:43
GLM-4.5テクニカルレポートを発表! 👇
この研究は、独自の多段階トレーニング パラダイムを通じて、推論、コーディング、エージェント タスクに優れたモデルをどのように開発したかを示しています。
主なイノベーションには、機能を統合するための自己蒸留によるエキスパート モデルの反復、動的な問題解決のためのハイブリッド推論モード、難易度ベースの強化学習カリキュラムなどがあります。

28.62K
Tim Dettmers reposted
思考のシャワー: Twitter/X のペイアウトを保持する代わりに、選択した「PayoutChallenge」に向けましょう。
これは、過去 3 回のペイアウト $5478.51 を合わせた、このラウンドの私のものです。
AIが上昇している間、人類が堕落しないようにすることが不可欠です。人類は立ち上がり続け、一緒に良くなりなければなりません。チームヒューマンを高揚させるために特別に設計されたものを作成します。定義は、人々の解釈にエントロピーを保つために意図的に少し曖昧なままにしましたが、imoの例は次のとおりです。
- 説明、視覚化、暗記、インスピレーション、理解、調整などを支援するソフトウェア...
- 高尚すぎる必要はありません、たとえば、他の人が恩恵を受けることができることや、あなたが独自の知識を持っていることを説明する特定の教育記事/ビデオである可能性があります。
- 説明を求めるプロンプト/エージェント (たとえば、最近リリースされた ChatGPT 学習モードに沿って)。
- 関連芸術作品
このチャレンジは、8 月 17 日 EOD PST までの 2 週間実施されます。返信として投稿を送信してください。それは、この課題のために独自に作成されたものでなければならず、そうでなければ存在しないものでなければなりません。基準には、実行、レバレッジ、目新しさ、インスピレーション、美学、娯楽が含まれます。人々は「いいね!」することで投稿に賛成票を投じることができ、この「人々の選択」も要因になります。8月17日に勝者を決定し、5478.51ドルを送金します:)
677.06K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable