Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
PUMP công khai đã kết thúc, ban đầu tôi cũng đã đầu tư lớn vào Bybit, chỉ để lại 1/2 trên chuỗi, cuối cùng chỉ có giao dịch trên chuỗi thành công, may mắn là không phải bảo hiểm trước…
Nói về việc gần đây có nhiều người trong cộng đồng AI đang thảo luận về VLA (Vision‑Language‑Action)
Tôi đã đặc biệt nghiên cứu xem có ai đang làm dự án liên quan đến VLA trên chuỗi không, và đã thấy dự án CodecFlow @Codecopenflow, tôi đã mua một ít.
== CodecFlow đang làm gì ==
Giới thiệu ngắn gọn về VLA, VLA là một mô hình cho phép AI không chỉ "có thể nói", mà còn "có thể làm".
Các LLM truyền thống (như GPT) chỉ có thể hiểu ngôn ngữ, cung cấp gợi ý, nhưng chúng không thể thực hiện thao tác, không thể nhấp vào màn hình, không thể lấy vật thể.
Mô hình VLA có nghĩa là tích hợp ba khả năng lớn:
1. Vision (thị giác): hiểu hình ảnh, chụp màn hình, đầu vào từ camera hoặc dữ liệu cảm biến
2. Language (ngôn ngữ): hiểu lệnh ngôn ngữ tự nhiên của con người
3. Action (hành động): tạo ra các lệnh có thể thực hiện, như nhấp chuột, nhập bàn phím, điều khiển cánh tay robot
CodecFlow đang làm VLA trên chuỗi, tất cả quy trình hoạt động còn có thể được ghi lại trên chuỗi, có thể kiểm toán, có thể xác minh, có thể thanh toán.
Nói một cách đơn giản, đây là "hạ tầng cơ bản của robot AI".
== Tại sao tôi đặc biệt chú ý đến dự án này? ==
Tôi phát hiện ra rằng các nhà phát triển của họ là những người đóng góp cốt lõi cho dự án mã nguồn mở LeRobot nổi tiếng trong lĩnh vực VLA!
LeRobot là một trong những cơ sở hàng đầu để xây dựng mô hình VLA trong cộng đồng mã nguồn mở, bao gồm cả SmolVLA, một VLA nhẹ có thể chạy trên laptop.
Điều này cho thấy đội ngũ này thực sự hiểu cấu trúc VLA và Robot.
Tôi thấy họ cũng đang tiếp tục xây dựng, giá coin cũng ổn định tăng lên, tôi rất lạc quan về lĩnh vực VLA, và từ xu hướng tổng thể, VLA và robot thực sự là tương lai trên thị trường.
• Các ông lớn Web2 (Google, Meta, Tesla) hiện đang đầu tư mạnh vào VLA & đào tạo robot;
• Các dự án Web3 rất ít có ứng dụng VLA có thể thực hiện nhiệm vụ, vẫn còn rất hiếm
• VLA có cơ hội phát huy giá trị lớn trong các tình huống như DePIN, Tự động hóa Web, thực hiện AI Agent trên chuỗi.
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Luôn luôn DYOR.

26 thg 6, 2025
Nhà điều hành $CODEC là gì?
Đó là nơi các mô hình Vision-Language-Action cuối cùng đã làm cho AI trở nên hữu ích cho công việc thực tế.
Operator là một tác nhân phần mềm tự trị được hỗ trợ bởi các mô hình VLA thực hiện các nhiệm vụ thông qua một chu kỳ nhận thức-lý luận-hành động liên tục.
LLM có thể suy nghĩ và nói chuyện một cách xuất sắc, nhưng họ không thể trỏ, nhấp hoặc lấy bất cứ thứ gì. Chúng là những động cơ lý luận thuần túy không có nền tảng trong thế giới vật lý.
VLA kết hợp nhận thức thị giác, hiểu ngôn ngữ và đầu ra hành động có cấu trúc trong một lần chuyển tiếp. Trong khi LLM mô tả những gì sẽ xảy ra, mô hình VLA thực sự làm cho nó xảy ra bằng cách phát ra tọa độ, tín hiệu điều khiển và các lệnh thực thi.
Quy trình làm việc của Operator là:
- Nhận thức: chụp ảnh màn hình, nguồn cấp dữ liệu máy ảnh hoặc dữ liệu cảm biến.
- Lý luận: xử lý các quan sát cùng với các hướng dẫn ngôn ngữ tự nhiên bằng cách sử dụng mô hình VLA.
- Hành động: thực hiện các quyết định thông qua tương tác giao diện người dùng hoặc điều khiển phần cứng—tất cả trong một vòng lặp liên tục.
Ví dụ: LLM so với nhà khai thác được hỗ trợ bởi mô hình VLA
Lên lịch cuộc họp
LLM: Cung cấp giải thích chi tiết về quản lý lịch, phác thảo các bước để lên lịch cuộc họp.
Nhà điều hành với mô hình VLA:
- Chụp màn hình của người dùng.
- Xác định ứng dụng lịch (ví dụ: Outlook, Lịch Google).
- Điều hướng đến thứ Năm, tạo cuộc họp lúc 2 giờ chiều và thêm người tham dự.
- Tự động thích ứng với các thay đổi giao diện người dùng.
Robot: Phân loại đối tượng
LLM: Tạo các hướng dẫn bằng văn bản chính xác để sắp xếp các đối tượng, chẳng hạn như xác định và sắp xếp các thành phần màu đỏ.
Nhà điều hành với mô hình VLA:
- Quan sát không gian làm việc trong thời gian thực.
- Xác định các thành phần màu đỏ giữa các đối tượng hỗn hợp.
- Lập kế hoạch quỹ đạo không va chạm cho cánh tay robot.
- Thực hiện các thao tác chọn và đặt, tự động điều chỉnh theo các vị trí và hướng mới.
Các mô hình VLA cuối cùng đã thu hẹp khoảng cách giữa AI có thể suy luận về thế giới và AI thực sự có thể thay đổi nó. Chúng là những gì biến đổi tự động hóa từ tuân thủ các quy tắc mong manh thành giải quyết vấn đề thích ứng — những người lao động thông minh.
"Các kịch bản truyền thống bị hỏng khi môi trường thay đổi, nhưng Người vận hành sử dụng sự hiểu biết trực quan để thích ứng trong thời gian thực, xử lý các ngoại lệ thay vì gặp sự cố trên chúng."

11,22K
Hàng đầu
Thứ hạng
Yêu thích