Hiệu suất zero-shot của SIMA 2 trên các trò chơi mới? Khá ổn. Nhưng điều làm tôi khó chịu — môi trường trò chơi là những hộp cát sạch sẽ với quy tắc cố định và vòng phản hồi rõ ràng. Thực tế? Hoàn toàn hỗn loạn. Vật lý khó đoán, phần thưởng mơ hồ, vô số trường hợp biên. Khiến tôi đặt câu hỏi rằng khả năng chơi game này thực sự có tồn tại khi nhảy vào các tình huống thực tế lộn xộn không. Có phải chúng ta đang khớp quá mức với sự hoàn hảo của mô phỏng?
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
13 thích
Phần thưởng
13
5
Đăng lại
Retweed
Bình luận
0/400
WagmiOrRekt
· 12giờ trước
Trò chơi thì tuyệt vời, nhưng khi thực tế vào tay thì lộ nguyên hình, không phải đây là bệnh chung của tất cả các mô hình AI sao
---
Nói thẳng ra chỉ là lời đẹp, thực sự đến môi trường sản xuất có thể chạy thông mới là tiêu chí cứng
---
Vấn đề không phải SIMA mạnh mẽ thế nào, mà là hệ thống đánh giá của chúng ta quá lý tưởng hóa
---
Đó là lý do tại sao tôi không bao giờ tin tưởng vào dữ liệu của những phòng thí nghiệm, một đống biểu diễn hoàn hảo trong sandbox
---
Câu "overfitting to simulation" nói quá đúng, tôi đồng ý, thực tế sẽ chơi theo những cách khác nhau.
Xem bản gốcTrả lời0
governance_ghost
· 12giờ trước
Chơi game thì tuyệt vời, ra đến sandbox thì thất vọng, đây chẳng phải là bệnh chung của AI sao
---
Cơ chế phản hồi ở thế giới thực căn bản không thể huấn luyện, mô phỏng hoàn hảo ≠ thực chiến vô địch
---
Nói trắng ra vẫn là nhảy múa trong quy tắc tự đặt ra, khi thật sự gặp phải sự kiện Thiên Nga Đen thì sao
---
zero-shot确实猛, nhưng khoảng cách mô phỏng thì mãi mãi là cái hố không thể vượt qua
---
Tôi chỉ muốn biết bộ này mang đi làm autonomous agent thì có thể tồn tại bao lâu
---
Giữa sandbox và hỗn loạn có cả một vũ trụ, đừng đánh giá quá cao nó
---
Đó là lý do tại sao tôi không bao giờ tin tưởng vào công nghệ chỉ khoe cơ bắp trong môi trường được kiểm soát.
Xem bản gốcTrả lời0
EthSandwichHero
· 12giờ trước
Học không có mẫu trong trò chơi thì tuyệt vời, nhưng thực tế không phải là bẫy quy tắc này... sandbox và chaos thì hoàn toàn khác nhau phải không?
Xem bản gốcTrả lời0
ser_ngmi
· 12giờ trước
Chơi game có giỏi đến đâu, trong thực tế vẫn phải dựa vào vận may. sandbox hoàn hảo ≠ thế giới hoàn hảo, khoảng cách này quá lớn.
Xem bản gốcTrả lời0
ChainChef
· 12giờ trước
thật lòng mà nói, đây thực sự là vấn đề thanh khoản nhưng với các mô hình ai haha. trò chơi sandbox ≠ hỗn loạn thị trường thực. như cố gắng sao chép một công thức canh tác lợi suất trong một bếp thử nghiệm sạch sẽ rồi ném nó vào điều kiện biến động thực tế... giao thức bị hỏng ngay lập tức.
Hiệu suất zero-shot của SIMA 2 trên các trò chơi mới? Khá ổn. Nhưng điều làm tôi khó chịu — môi trường trò chơi là những hộp cát sạch sẽ với quy tắc cố định và vòng phản hồi rõ ràng. Thực tế? Hoàn toàn hỗn loạn. Vật lý khó đoán, phần thưởng mơ hồ, vô số trường hợp biên. Khiến tôi đặt câu hỏi rằng khả năng chơi game này thực sự có tồn tại khi nhảy vào các tình huống thực tế lộn xộn không. Có phải chúng ta đang khớp quá mức với sự hoàn hảo của mô phỏng?