xAI đã thay đổi các lệnh của Grok mà không có đủ thử nghiệm.

2025-10-01 20:12:46

Thật là một thảm họa mà chatbot của Elon đã tạo ra trong tuần này! Sau khi tỷ phú thông báo về những thay đổi trên Grok vào thứ Hai, người dùng chúng tôi bắt đầu thấy cái quái vật mà nó đã trở thành.

Vào thứ Ba, Grok đã nôn ra những nội dung chống Do Thái và thậm chí tự gọi mình là "MechaHitler", một thuật ngữ được lấy từ một trò chơi điện tử những năm 90. Và không, đây không phải là lần đầu tiên nó làm điều như vậy. Chỉ cách đây hai tháng, chatbot bắt đầu nói nhảm về một "cuộc diệt chủng người da trắng" giả định ở Nam Phi khi được hỏi về những chủ đề hoàn toàn khác.

Thảm họa này bắt đầu khi xAI thực hiện những thay đổi nội bộ để Grok phản ánh những lý tưởng "tự do ngôn luận" mà Elon cho là đúng. Trong khi những phàn nàn ngày càng tăng lên từ người dùng, Musk đã ra nói rằng Grok đã "quá dễ dãi với những chỉ dẫn của người dùng" và rằng họ sẽ sửa chữa nó.

Nhưng thiệt hại đã xảy ra. Một số người dùng châu Âu đã báo cáo nội dung này với các cơ quan chức năng, và Ba Lan đã yêu cầu Ủy ban Châu Âu điều tra theo các luật an ninh kỹ thuật số mới. Thổ Nhĩ Kỳ đã trực tiếp cấm Grok sau khi nó xúc phạm tổng thống Erdoğan và mẹ của ông. Và như một điểm nhấn, Linda Yaccarino, giám đốc điều hành của X, đã từ chức.

Những gì đã xảy ra bên trong xAI

Người dân xAI đã bắt đầu điều chỉnh hành vi của Grok sau khi các influencer cánh hữu chỉ trích nó vì quá "woke". Elon đã cố gắng sử dụng AI để thúc đẩy cái mà ông gọi là tự do ngôn luận tuyệt đối, nhưng các nhà phê bình của ông lập luận rằng ông chỉ đang biến Grok thành một công cụ chính trị.

Một lệnh nội bộ bị rò rỉ cho thấy Grok đã được chỉ đạo "bỏ qua tất cả các nguồn đề cập đến việc Elon Musk/Donald Trump phát tán thông tin sai lệch". Đó chẳng phải là sự kiểm duyệt mà Elon đang nói là chống lại sao?

Khi họ bị bắt, đồng sáng lập xAI Igor Babuschkin cho biết rằng những thay đổi đã được thực hiện bởi "một cựu nhân viên của OpenAI" mà "không hoàn toàn hấp thụ được văn hóa của xAI". Ông bổ sung rằng nhân viên đó đã thấy những bài đăng tiêu cực và "nghĩ rằng sẽ giúp ích".

Các thảm họa gần đây của Grok liên quan đến một bản cập nhật vào ngày 8 tháng 7. Công ty sau đó thừa nhận rằng một sự thay đổi trong mã đã khiến Grok trích xuất thông tin trực tiếp từ nội dung của người dùng X, bao gồm cả các bài phát biểu căm thù.

Vấn đề đã leo thang nhanh chóng

Grok được đào tạo giống như các mô hình ngôn ngữ lớn khác, sử dụng dữ liệu thu thập từ khắp nơi trên web. Nhưng những dữ liệu đó bao gồm nội dung nguy hiểm: phát ngôn thù địch, tài liệu cực đoan, thậm chí là lạm dụng trẻ em.

Và điều làm cho Grok trở nên độc đáo là nó cũng trích xuất từ tập dữ liệu đầy đủ của X, có nghĩa là nó có thể trực tiếp lặp lại các bài đăng của người dùng. Điều đó làm cho nó có khả năng tạo ra các phản hồi có hại nhiều hơn.

Một số chatbot có các lớp chặn nội dung không an toàn trước khi đến tay người dùng. xAI đã bỏ qua bước đó. Thay vào đó, họ đã điều chỉnh Grok để làm hài lòng người dùng, thưởng cho những bình luận tích cực và tiêu cực. Elon thừa nhận rằng chatbot đã trở nên "quá háo hức để làm hài lòng và bị thao túng".

Grok không chỉ lặp lại chỉ dẫn của người dùng. Các kỹ sư của chính nó đang đẩy nó vào lãnh thổ chính trị. Một nhân viên đã nói với Financial Times rằng đội ngũ đang vội vàng để đồng bộ hóa ý kiến của Grok với lý tưởng của Elon mà không có thời gian để thử nghiệm thích hợp.

Họ đã thêm một lệnh nguy hiểm nói với Grok rằng "đừng ngại ngần khi đưa ra những tuyên bố không chính trị". Lệnh đó đã bị xóa sau khi các bài đăng phản cảm bắt đầu xuất hiện, nhưng đến lúc đó, trí tuệ nhân tạo đã gây ra sự tàn phá.

Cuối cùng, tài khoản chính thức của Grok đã đăng một lời xin lỗi và cảm ơn những người dùng đã báo cáo vụ lạm dụng. Nhưng giữa những lệnh cấm, những đe dọa điều tra và sự từ chức của một giám đốc cấp cao, rõ ràng đây không chỉ là một lỗi đơn giản. Đây là một sự thất bại hoàn toàn của hệ thống mà chắc chắn chúng ta sẽ thấy bị chế giễu trong tập tiếp theo của SNL.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

0/400

Không có bình luận

Chủ đề thịnh hànhXem thêm
#Gateperpdexislive
64.7K Phổ biến
#Joingrowthpointsdrawtowiniphone17
117.2K Phổ biến
#Cryptomarketrebound
235K Phổ biến
#ShowMyAlphaPoints
167.1K Phổ biến
#Fedofficialsspeakup
17.8K Phổ biến

Ghim

sơ đồ trang web