Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nuôi Dưỡng Một Đại Lý - Tập 8
Trong tập này, @beyang ngồi xuống với @camden_cheek để thảo luận về cách đội ngũ Amp đánh giá các mô hình mới: tại sao việc gọi công cụ là yếu tố phân biệt chính, các mô hình mở như K2 và Qwen so sánh như thế nào, những thay đổi của GPT-5, và tại sao các "kiểm tra cảm xúc" định tính thường quan trọng hơn các tiêu chuẩn. Họ cũng đi sâu vào các đại lý phụ, hợp kim mô hình, và tương lai của lập trình đại lý bên trong Amp.
Thời gian:
0:00 Giới thiệu — Tại sao việc đánh giá mô hình lại quan trọng
1:06 Triết lý đa mô hình của Amp
3:16 Tại sao Gemini Pro không thành công
4:55 Thất bại trong việc gọi công cụ & sự gián đoạn của người dùng
6:09 Suy giảm lặp lại so với tự điều chỉnh
10:08 Cơn sốt mô hình mở (K2, Qwen)
11:22 Thời kỳ "56k của các đại lý"
18:01 Ấn tượng đầu tiên về GPT-5
20:35 Hợp kim các mô hình & Oracle như phương án dự phòng
24:26 Cảm giác khác biệt của GPT-5 (tính cách & khả năng điều chỉnh)
29:10 Vượt qua ngưỡng khả dụng
38:13 Tại sao cảm xúc > tiêu chuẩn
44:18 Kiểm tra hồi quy & triết lý đánh giá
46:21 Tương lai đa mô hình > người chiến thắng đơn lẻ
52:38 Những suy nghĩ cuối cùng
10,65K
Hàng đầu
Thứ hạng
Yêu thích