トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Peter Yang
音声は AI にとって大きな変革をもたらしますが、完璧な「エージェント」音声ツールをまだ誰も構築していません。
1. ChatGPT: 独白したいときに邪魔されすぎます。
2. クロード:最後に試してみましたが、ハンズフリーの目的を打ち負かすために毎回画面をタップして応答する必要がありました。
3. @WisprFlow / @superwhisperapp:どちらも非常に優れていますが(最近Wispr Flowを使い始めました)、どちらも電子メールや生産性向上アプリを制御できません。
Claude / ChatGPT / Gemini は、おそらく以下の Matt のアイデアの実現に最も近いでしょう。

Matthew Berman8月21日 06:23
運転中に実際の仕事をこなせる音声 AI に月額 1,000 ドルを支払います。メールに返信したり、会議をスケジュールしたり、その他のタスクを実行したりします
6.36K
AI 評価を作成するための 3 つのベスト プラクティス:
1. スピードと厳しさのバランスをとる
12 個のテスト ケースから始めて、そこから反復します。まだプロンプトで大きな変更を行っているときに 100 をビルドしないでください。最大の障害モードを特定して修正し、カバレッジを拡大します。
2. 評価基準と手動ラベルにこだわる
評価基準とゴールデンデータセットは、他のすべての基盤です。スプレッドシートでこの手作業を回避することはできません - 人間のラベルを良いものにすることに執着します。
3. LLM の判断を時期尚早に拡張しない
スケーリングする前に、LLMジャッジと人間のラベラーの間で~80%の整合性を目指してください。結果を定期的に監査する - それが常に正しいと思い込まないでください。
明日は、誰でも従うことができる段階的な例を説明した AI 評価に関する初心者向けガイドを共有します。
📌 サインアップして受信トレイに届けてください。
(追伸LLMの裁判官の姿はこう想像しています)

4.74K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable