Giám đốc điều hành của Google DeepMind: AGI vẫn còn 5 đến 10 năm nữa, và các cơ hội và rủi ro phát triển AI đi đôi với nhau

Trong đêm chung kết của “Hội nghị thượng đỉnh AI + SF” do Axios tổ chức tại San Francisco, Demis Hassabis, Giám đốc điều hành của Google DeepMind, đã vạch ra các hướng nghiên cứu của DeepMind, những tiến bộ công nghệ như mô hình đa phương thức và thế giới, đồng thời thảo luận về sự phát triển của các tác nhân AI và các rủi ro liên quan. Ông cũng đánh giá sự cạnh tranh về AI giữa Mỹ và Trung Quốc, đồng thời đưa ra ước tính hiếm hoi về dòng thời gian AGI, tin rằng còn khoảng 5 đến 10 năm nữa trước khi có “hệ thống AI có khả năng nhận thức của con người”.

Với sự ban phước của hào quang Nobel, tư duy của các nhà khoa học thống trị DeepMind

Mở đầu sự kiện, người dẫn chương trình Mike Allen đã giới thiệu Hassabis là một thần đồng cờ vua 5 tuổi và là người đoạt giải Nobel 48 tuổi. Hassabis thừa nhận rằng việc giành được giải thưởng vẫn cảm thấy siêu không thực, nhưng tác động thực tế là rõ ràng.

Bởi vì khi ông nói chuyện với các quan chức chính phủ hoặc những người ra quyết định xuyên biên giới không quen thuộc với AI, “giải Nobel” giống như một chiếc chìa khóa có thể nhanh chóng mở bất kỳ cánh cửa nào, khiến họ sẵn sàng lắng nghe ông nói về các vấn đề như an toàn AI và sử dụng có trách nhiệm, và ông dự định sẽ sử dụng tích cực hơn danh hiệu này trong tương lai.

Khi nói đến công việc hàng ngày và phong cách quản lý của mình, Hassabis nhấn mạnh rằng ông “luôn đứng đầu với tư cách là một nhà khoa học và một CEO đứng thứ hai”. Trong mắt ông, phương pháp khoa học là một trong những phát minh quan trọng nhất của nhân loại, và ông trực tiếp áp dụng quy trình “xây dựng giả thuyết, thiết kế thí nghiệm, cập nhật ý kiến dựa trên kết quả” trực tiếp vào phát triển sản phẩm và quản lý tổ chức.

Lợi thế của DeepMind đến từ ba cấp độ cùng một lúc, đó là “nghiên cứu đẳng cấp thế giới, khả năng kỹ thuật đẳng cấp thế giới và cơ sở hạ tầng máy tính đẳng cấp thế giới”. Ông tin rằng chỉ khi ba cấp độ này được thực hiện đồng thời, DeepMind mới có đủ điều kiện để đi đầu trong phát triển AI.

Bố cục trong 12 tháng tới: phát triển đa phương thức, mô hình thế giới và tác nhân

Nói về tiến bộ cụ thể của AI trong 12 tháng tới, Hassabis chỉ ra rằng Gemini được thiết kế như một mô hình đa phương thức ngay từ đầu, có thể xử lý văn bản, hình ảnh, video và âm thanh cùng một lúc. Ví dụ, mô hình hình ảnh mới nhất của anh ấy, “Nano Banana Pro”, có thể tạo ra đồ họa thông tin rất chính xác, cho thấy khả năng hiểu trực quan của mô hình đang được cải thiện nhanh chóng.

Trọng tâm thứ hai là mô hình thế giới (World Models). Genie 3, được phát triển bởi DeepMind, có thể tạo ra các video tương tác cho phép người dùng không chỉ xem video mà còn bước vào màn hình như thể họ đang bước vào một trò chơi, duy trì tính nhất quán và mạch lạc trên thế giới trong khoảng một phút. Loại mô hình này được coi là một bước quan trọng trong sự hiểu biết của AI về ngoại hình và quy tắc trong thế giới thực.

Thứ ba là các tác nhân AI. Hassabis thừa nhận rằng các tác nhân AI hiện tại không thể nhẹ nhõm khi ném toàn bộ gói nhiệm vụ trực tiếp vào nó, đảm bảo rằng nó được thực hiện tốt từ đầu. Nhưng ông kỳ vọng rằng trong một năm, niềm tin của các tác nhân AI chắc chắn sẽ tăng lên. Mục tiêu của Google là biến Gemini trở thành một “trợ lý vạn năng” không chỉ tồn tại trên điện thoại di động và máy tính, mà có thể ở bên cạnh người dùng bất cứ lúc nào thông qua các thiết bị đeo được như kính, trở thành trợ thủ đắc lực cho cuộc sống và công việc hàng ngày.

Thử nghiệm (: Gemini 3 Nano Banana Pro tự động tạo ra những bộ phim hoạt hình hài hước sau khi suy nghĩ, biến Trump trở lại thành một ) thịt tươi nhỏ

Tương lai hứa hẹn cho việc khám phá vũ trụ, nhưng rủi ro bảo mật cũng quan trọng như hiểu video

Nói về những kịch bản tốt nhất mà AI có thể mang lại, Hassabis đưa ra giả thuyết rằng AI có thể giúp nhân loại vượt qua một số nút thắt chính, chẳng hạn như phản ứng tổng hợp hạt nhân hoặc pin mới, những đột phá mới trong khoa học vật liệu và chất bán dẫn, và các giải pháp cho các bệnh lớn, và xã hội loài người sẽ có cơ hội tiến tới khám phá không gian với nguồn tài nguyên dồi dào hơn.

Nhưng ông cũng chỉ ra kịch bản xấu nhất, được chia thành nhiều cấp độ:

Các tác nhân độc hại sử dụng AI để thiết kế hoặc tăng cường mầm bệnh.

AI đẩy nhanh các cuộc tấn công mạng của các lực lượng nước ngoài vào cơ sở hạ tầng quan trọng như năng lượng và tài nguyên nước, và những điều như vậy có thể xảy ra, nhưng AI được sử dụng vẫn chưa tiên tiến.

Các tác nhân AI có khả năng tự chủ cao đi chệch khỏi hướng dẫn ban đầu và kỳ vọng của con người, vì vậy họ phải đầu tư nguồn lực và sự chú ý đáng kể để ngăn chặn chúng.

Về khả năng, anh tin rằng phần bị đánh giá thấp của thế giới bên ngoài là sự hiểu biết sâu sắc của AI về video. Hassabis chia sẻ rằng anh đã từng nhờ Song Tử phân tích cảnh, và người mẫu không chỉ hiểu bức tranh mà còn đưa ra cách giải thích rất sâu sắc về các biểu tượng và cảm xúc, thay vì chỉ mô tả những hành động hời hợt.

Anh ấy cũng đề cập rằng Gemini Live cho phép bạn nhận được hỗ trợ sửa chữa ngay lập tức bằng cách hướng camera điện thoại của bạn vào thiết bị cơ khí, nhưng anh ấy tin rằng phương tiện thực sự lý tưởng sẽ là kính, bởi vì tay của bạn phải trống rỗng trong quá trình hoạt động tại chỗ để làm việc và tương tác với AI cùng một lúc.

Chỉ còn vài tháng nữa trong khoảng cách giữa Hoa Kỳ và Trung Quốc, và AGI vẫn còn một hoặc hai dặm nữa

Khi nói đến cạnh tranh quốc tế, Hassabis tin rằng Mỹ và phương Tây vẫn đang dẫn đầu Trung Quốc nói chung về khả năng mô hình và đổi mới, nhưng hàng loạt mô hình mới nhất của Trung Quốc, chẳng hạn như DeepSeek, đã rất mạnh và hầu hết chúng đang bắt kịp nhanh chóng trên cơ sở các công nghệ hiện có. Ông đánh giá rằng trong quá khứ, Mỹ và phương Tây có thể đã dẫn đầu trong nhiều năm, nhưng bây giờ chỉ còn vài tháng nữa là đi trước Trung Quốc.

Hassabis định nghĩa AGI khá rõ ràng, cụ thể là:

“Bạn phải có tất cả các khả năng nhận thức chính của con người, bao gồm lập kế hoạch dài hạn, trí nhớ dài hạn, học hỏi liên tục, lý luận và sáng tạo thực sự, v.v.”

Ông chỉ ra rằng mặc dù LLM ở giai đoạn này đã có khả năng tiếp cận các bác sĩ hàng đầu trong một số lĩnh vực, nhưng họ vẫn sẽ mắc sai lầm trong nhiều tình huống và vẫn còn khoảng cách giữa AGI thực sự và ước tính mất từ 5 đến 10 năm. Hassabis nói thêm rằng ngay cả khi quy mô của các LLM hiện có bị đẩy đến giới hạn, nó vẫn không đủ để vượt qua ngưỡng AGI và lĩnh vực AI có thể cần một hoặc hai đột phá công nghệ lớn có thể cải thiện đáng kể khả năng, chẳng hạn như máy biến áp, trước khi có cơ hội thực sự đạt được AGI.

(IBM CEO: Ngành công nghiệp AI là một canh bạc “khó phục hồi”, với LLM chỉ có 1% cơ hội tạo ra thành công ) AGI

Các bài viết Giám đốc điều hành Google DeepMind: AGI còn 5 đến 10 năm nữa, cơ hội và rủi ro phát triển AI đi đôi với nhau appeared first on Chain News ABMedia.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim