Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Nuôi Dưỡng Một Đại Lý - Tập 8 Trong tập này, @beyang ngồi xuống với @camden_cheek để thảo luận về cách đội ngũ Amp đánh giá các mô hình mới: tại sao việc gọi công cụ là yếu tố phân biệt chính, các mô hình mở như K2 và Qwen so sánh như thế nào, những thay đổi của GPT-5, và tại sao các "kiểm tra cảm xúc" định tính thường quan trọng hơn các tiêu chuẩn. Họ cũng đi sâu vào các đại lý phụ, hợp kim mô hình, và tương lai của lập trình đại lý bên trong Amp. Thời gian: 0:00 Giới thiệu — Tại sao việc đánh giá mô hình lại quan trọng 1:06 Triết lý đa mô hình của Amp 3:16 Tại sao Gemini Pro không thành công 4:55 Thất bại trong việc gọi công cụ & sự gián đoạn của người dùng 6:09 Suy giảm lặp lại so với tự điều chỉnh 10:08 Cơn sốt mô hình mở (K2, Qwen) 11:22 Thời kỳ "56k của các đại lý" 18:01 Ấn tượng đầu tiên về GPT-5 20:35 Hợp kim các mô hình & Oracle như phương án dự phòng 24:26 Cảm giác khác biệt của GPT-5 (tính cách & khả năng điều chỉnh) 29:10 Vượt qua ngưỡng khả dụng 38:13 Tại sao cảm xúc > tiêu chuẩn 44:18 Kiểm tra hồi quy & triết lý đánh giá 46:21 Tương lai đa mô hình > người chiến thắng đơn lẻ 52:38 Những suy nghĩ cuối cùng

10,65K

Hàng đầu

Thứ hạng

Yêu thích

Onchain thịnh hành

Thịnh hành trên X

Ví funding hàng đầu gần đây

Được chú ý nhất