Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Xây dựng siêu trí tuệ toán học
CẬP NHẬT: Phân tích cho thấy Putnam dễ hơn 4 lần / yêu cầu ít lý luận hơn nhiều so với IMO.
Chiều dài chứng minh Aristotle Lean4 trung bình cho 10 bài toán Putnam đã giải là ~250 dòng, so với ~1000 cho IMO, giảm 75%.
Chúng tôi đang khám phá việc áp dụng tính toán mở rộng cho hai bài khác (A5 và B4), để định lượng chính xác hơn độ khó tương đối.
Một số lưu ý: đã có những cải tiến về mô hình / thuật toán kể từ kết quả IMO đạt huy chương vàng của Aristotle, nhưng phiên bản dành cho người tiêu dùng có sẵn cho công chúng yếu hơn nhiều so với những gì đã được sử dụng nội bộ để giải các bài toán IMO.
Là những người hâm mộ Putnam, ngay cả chúng tôi cũng phải thừa nhận — IMO vẫn là vua. 👑

Harmonic06:56 11 thg 12
TIN NÓNG: Phiên bản tiêu dùng của Aristotle đã vượt qua Putnam, giải quyết và xác minh chính thức 10/12 bài toán trong @leanprover.
Chúc mừng nhà toán học nghiệp dư @namrata_anand2, người đã sử dụng phiên bản tiêu dùng của Aristotle với một bản phát hành công khai sớm của các bài toán. Có vẻ như Aristotle đã giải quyết chúng một cách dễ dàng, tự động giải quyết 10/12 bài toán.
Chúng tôi hiện đang xem xét các tệp và sẽ chia sẻ thêm chi tiết sau, nhưng có hai điều hữu ích cần lưu ý ngay bây giờ:
▪️ Đây có vẻ là những giải pháp chính thức hoàn toàn đầu tiên cho các bài toán Putnam 2025 được phát hành công khai.
▪️ Tất cả đều sử dụng giao diện ngôn ngữ tự nhiên mới được phát hành, trong đó Aristotle đã nhận câu hỏi bằng ngôn ngữ tự nhiên, sau đó tự động hình thức hóa nó thành một tuyên bố Lean4, và sau đó hoàn thành chứng minh, hoàn toàn tự động mà không có sự can thiệp của con người. Trong quá khứ, chúng tôi đã tập trung vào khả năng chứng minh định lý tiên tiến của Aristotle, nhưng giờ đây nó cũng đang trở nên khá khả năng trong việc tự động hình thức hóa.
Chúng ta đang bước vào một bình minh mới cho AI và toán học. Từ từ... rồi tất cả cùng một lúc!
66,7K
TIN NÓNG: Phiên bản tiêu dùng của Aristotle đã vượt qua Putnam, giải quyết và xác minh chính thức 10/12 bài toán trong @leanprover.
Chúc mừng nhà toán học nghiệp dư @namrata_anand2, người đã sử dụng phiên bản tiêu dùng của Aristotle với một bản phát hành công khai sớm của các bài toán. Có vẻ như Aristotle đã giải quyết chúng một cách dễ dàng, tự động giải quyết 10/12 bài toán.
Chúng tôi hiện đang xem xét các tệp và sẽ chia sẻ thêm chi tiết sau, nhưng có hai điều hữu ích cần lưu ý ngay bây giờ:
▪️ Đây có vẻ là những giải pháp chính thức hoàn toàn đầu tiên cho các bài toán Putnam 2025 được phát hành công khai.
▪️ Tất cả đều sử dụng giao diện ngôn ngữ tự nhiên mới được phát hành, trong đó Aristotle đã nhận câu hỏi bằng ngôn ngữ tự nhiên, sau đó tự động hình thức hóa nó thành một tuyên bố Lean4, và sau đó hoàn thành chứng minh, hoàn toàn tự động mà không có sự can thiệp của con người. Trong quá khứ, chúng tôi đã tập trung vào khả năng chứng minh định lý tiên tiến của Aristotle, nhưng giờ đây nó cũng đang trở nên khá khả năng trong việc tự động hình thức hóa.
Chúng ta đang bước vào một bình minh mới cho AI và toán học. Từ từ... rồi tất cả cùng một lúc!

Namrata Anand06:27 11 thg 12
Aristotle từ @HarmonicMath đã giải được 10/12 bài toán trong vòng 7 giờ tại Putnam, cuộc thi toán học đại học khó nhất thế giới!
Làm thế nào tôi biết điều này? Chà, tôi đã chạy Aristotle qua API công khai của Harmonic. Và tôi mất khoảng 10 phút để bắt đầu và khởi động nó!
9 trong số 10 bài toán đã hoàn thành trong chưa đầy 3 giờ. Bài thứ mười (B5) mất 7 giờ, một giờ nhiều hơn so với thời gian mà các thí sinh được phép.
Đối với tất cả 10 bài toán, tôi đã cung cấp cho Aristotle các đề bài bằng tiếng Anh — và nó tự động hóa các đề bài, chứng minh chúng, và sản xuất các đầu ra đã được xác minh một cách tự động, mà không cần phản hồi từ con người.
Là một người yêu thích toán học nhưng không phải là chuyên gia, thật thú vị khi có một công cụ mạnh mẽ như vậy trong tầm tay!
130,48K
Hàng đầu
Thứ hạng
Yêu thích