Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI tại Olympic Toán học: Một Kỷ Nguyên Mới trong Giải Quyết Vấn Đề Toán Học
IMO từ lâu đã là cuộc thi toán khó nhất thế giới dành cho những sinh viên xuất sắc.
Giờ đây, nó cũng đang trở thành một tiêu chuẩn cho lý luận AI.👇
Năm nay đánh dấu một cột mốc:
Các mô hình AI từ Google DeepMind và OpenAI đã đạt được hiệu suất huy chương vàng trên các bài toán IMO — cùng mức với các thí sinh hàng đầu.
Một bước nhảy vọt thực sự trong khả năng của AI để suy luận qua toán học trừu tượng.
Dòng thời gian sự kiện:
> Thứ Sáu: Tin tức bị rò rỉ về màn trình diễn giành huy chương vàng của DeepMind
> Thứ Bảy 1 giờ sáng: OpenAI công bố kết quả trước khi có xác nhận chính thức
> Thứ Hai: DeepMind chính thức xác nhận trạng thái huy chương vàng với các giải pháp tinh tế được xác minh hoàn toàn bởi các quan chức IMO. Các giải pháp của họ tinh tế hơn và được kiểm tra nghiêm ngặt hơn.
Chuyển đổi công nghệ từ năm 2024 đến năm 2025
Năm ngoái: Các mô hình AI như AlphaGeometry cần dịch miền (Lean, v.v.) + 2–3 ngày tính toán.
Năm nay: Các mô hình của Gemini & OpenAI đã giải quyết các vấn đề từ đầu đến cuối bằng ngôn ngữ tự nhiên, trong giới hạn 4,5 giờ của IMO.
Sự khác biệt về phong cách
Câu trả lời của OpenAI:
> Hợp lý nhưng lộn xộn
> Thiếu cấu trúc, lạm dụng các thuật ngữ như "cấm"
> Hơn 400 dòng cho một số vấn đề
> Không dễ đọc cho con người
Chứng minh của Gemini:
> Thanh lịch và rõ ràng, theo ý kiến của giám khảo, chúng "dễ theo dõi"
> Có thể được coi là viết bởi con người
Bài toán 2 (Hình học) cho thấy khoảng cách:
OpenAI đã sử dụng hình học tọa độ brute-force → bằng chứng 442 dòng chính xác nhưng rườm rà
Gemini của DeepMind đã sử dụng theo góc và định lý Sylvester → một giải pháp ngắn gọn, sâu sắc phản ánh một con người có kỹ năng.
Tại sao Song Tử thành công
> Tư duy song song: Khám phá nhiều lộ trình giải pháp đồng thời
> Các kỹ thuật học tăng cường mới giúp tăng cường suy luận nhiều bước
> Truy cập vào các giải pháp toán học được tuyển chọn cẩn thận và các gợi ý chiến lược
Cách tiếp cận của OpenAI?
RL đa mục đích + mở rộng tính toán trong thời gian kiểm tra.
Điều này có nghĩa là gì
Giải quyết các bài toán IMO rất ấn tượng, nhưng toán học thực sự đi sâu hơn:
> Lý luận trừu tượng
> Tạo ý tưởng
> Trực giác nghiên cứu
Chúng ta vẫn chưa đạt được điều đó - nhưng đây là một bước tiến thực sự.
Để thực sự thúc đẩy khả năng toán học AI về phía trước, chúng ta sẽ cần:
> Chức năng phần thưởng chi tiết
> Đường ống RL chuyên dụng
> Hoặc có thể... một kỹ thuật ký tự đại diện không ai thấy sẽ đến
Khi AI tiến vào toán học, khoa học và nghiên cứu — nhu cầu về tính toán bùng nổ.
Đó là lý do tại sao việc truy cập vào cơ sở hạ tầng GPU có thể mở rộng và giá cả phải chăng là rất quan trọng.
Hãy biến tương lai đó trở nên dễ tiếp cận với tất cả mọi người.
Xem toàn bộ blog tại đây:
Podcast đầy đủ của chúng tôi với Latent Space ở đây:
1,06K
Hàng đầu
Thứ hạng
Yêu thích