Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

DeAI cạnh tranh với AI tập trung: Lợi thế, Ứng dụng và Vốn

Tác giả: 0xJeff, mã hóa KOL

Biên dịch: Felix, PANews

Ngày nay, mọi người đều đang bán hàng, bất kể là thực phẩm, chỗ ở, bách khoa toàn thư, sản phẩm điện tử, ứng dụng, hay AI gần đây.

Trong quá khứ, những món đồ được bán ra chủ yếu là những vật dụng thiết thực đáp ứng các nhu cầu ở mức độ thấp trong tháp nhu cầu của Maslow, còn ngày nay, người ta bán những giấc mơ và hy vọng, và bọc chúng trong những lớp vỏ hào nhoáng, đặc biệt là trong lĩnh vực mã hóa AI.

Mã hóa AI sản phẩm và cơ sở hạ tầng thường khó hiểu, dẫn đến việc đội ngũ sử dụng quá nhiều thuật ngữ chuyên ngành trong giao tiếp, không thể thu hút người dùng.

Ngoài ra, việc khởi động một phòng thí nghiệm AI thực sự (không chỉ là một gói đơn giản) cần một khoản đầu tư lớn để tài trợ cho nhân tài, những người đóng góp, tài nguyên tính toán và các nguồn lực cần thiết khác.

Chi phí của một phòng thí nghiệm AI cấp doanh nghiệp tiên tiến có thể lên đến hàng triệu đô la mỗi năm. Nếu đang nghiên cứu, đào tạo và tối ưu hóa các mô hình AI tiên tiến, chi phí có thể lên đến hàng trăm triệu đô la. Giá của GPU mẫu H100 dao động từ 25.000 đến 40.000 đô la, trong khi giá của GPU mẫu Blackwell B200 và GB200 mới hơn dao động từ 30.000 đến 70.000 đô la. Việc đào tạo một mô hình tiên tiến có thể cần đến hàng nghìn GPU như vậy.

Lợi ích của AI phi tập trung (DeAI): Mô hình nhỏ + Học tăng cường

Chọn hệ thống phi tập trung, nghĩa là phối hợp tài nguyên tính toán trên toàn cầu để đào tạo một mô hình duy nhất, lý thuyết có thể giảm mạnh chi phí GPU (tiết kiệm từ 30% đến 90%), vì bạn có thể tận dụng mạng GPU nhàn rỗi toàn cầu. Nhưng trên thực tế, việc phối hợp những GPU này và đảm bảo chúng đều hoạt động chất lượng cao là rất khó khăn. Do đó, hiện tại không có phòng thí nghiệm AI phi tập trung nào có thể giải quyết vấn đề đào tạo phi tập trung.

Tuy nhiên, tương lai vẫn có hy vọng, vì có một số phòng thí nghiệm đã đạt được những kết quả đáng khích lệ trong việc tăng cường học tập phi tập trung. Chính quá trình tự chơi, tự học này đã giúp một mô hình nhỏ trở nên vô cùng thông minh.

Không phải tất cả mọi tình huống đều cần đến mô hình ngôn ngữ lớn (LLM). Đào tạo các mô hình trong các lĩnh vực cụ thể và sử dụng học tăng cường (RL) để hoàn thiện và nâng cao kỹ năng của chúng là cách tiết kiệm và hiệu quả nhất để cung cấp giải pháp AI cấp doanh nghiệp, vì cuối cùng, khách hàng mong muốn kết quả (tuân thủ, an toàn, hiệu quả chi phí và có thể nâng cao năng suất).

Vào năm 2019, OpenAI Five đã đánh bại đội vô địch thế giới lúc bấy giờ là đội OG trong trò chơi 《Dota 2》. Điều này không phải là may mắn, mà là một sự nghiền nát hoàn toàn, đánh bại đội OG trong hai trận liên tiếp.

Bạn có thể thắc mắc nó đã được thực hiện như thế nào?

“Dota 2” là một trò chơi đấu trường trực tuyến nhiều người chơi cực kỳ phức tạp, trong đó 5 người chơi đối kháng với nhau, hoàn thành các mục tiêu khác nhau và phá hủy căn cứ của đối phương.

Để AI có thể đối đầu với các tay chơi hàng đầu, nó đã tuân theo các bước sau:

  • Bắt đầu từ con số không tự chiến đấu: Học kiến thức cơ bản, thực hiện hàng triệu lần tự chiến đấu. Nếu thắng, điều đó có nghĩa là thao tác đang có lợi; nếu thua, điều đó có nghĩa là thao tác không tốt (tức là thử sai quy mô lớn).
  • Thiết lập hệ thống thưởng (điểm), khuyến khích những hành động có thể mang lại giá trị kỳ vọng (EV) dương (như phá hủy tháp phòng thủ, tiêu diệt anh hùng), trong khi trừ điểm cho những hành động có giá trị kỳ vọng âm.
  • Phương pháp đào tạo sử dụng thuật toán học tăng cường có tên là “PPO”, AI sẽ thử nghiệm một số hành động trong trận đấu, PPO sẽ coi kết quả là phản hồi. Nếu kết quả tốt, thì sẽ làm nhiều hơn; nếu kết quả kém, thì sẽ làm ít hơn. Cách này dần dần dẫn AI theo hướng đúng.
  • Hàng trăm GPU đã chạy trong gần một năm để đào tạo AI, AI liên tục học hỏi và thích ứng với các phiên bản và thay đổi của trò chơi.
  • Sau một thời gian, nó bắt đầu tự khám phá các chiến lược phức tạp (hy sinh một đường lính, áp dụng lối chơi bảo thủ hoặc quyết liệt vào thời điểm thích hợp, nắm bắt thời điểm tấn công quy mô lớn, v.v.), và bắt đầu đối đầu với người chơi con người và giành chiến thắng.

Mặc dù OpenAI Five đã nghỉ hưu, nhưng nó đã truyền cảm hứng cho việc các mô hình nhỏ có thể cực kỳ hiệu quả trong các tác vụ lĩnh vực cụ thể (số lượng tham số của OpenAI Five chỉ là 58MB).

Lý do các phòng thí nghiệm AI lớn như OpenAI có thể làm được điều này là vì họ có vốn và tài nguyên để đào tạo các mô hình học tăng cường. Nếu một doanh nghiệp muốn sở hữu OpenAI Five của riêng mình để phát hiện gian lận, robot nhà máy, ô tô tự lái hoặc giao dịch trên thị trường tài chính, sẽ cần một khoản vốn lớn để thực hiện điều đó.

Học tăng cường phi tập trung đã giải quyết vấn đề này, đó là lý do tại sao các phòng thí nghiệm AI phi tập trung như Nous Research, Pluralis, gensyn, Prime Intellect và Gradient đang xây dựng mạng lưới GPU toàn cầu, cùng nhau đào tạo các mô hình học tăng cường, cung cấp cơ sở hạ tầng cho AI theo miền cụ thể cấp doanh nghiệp.

Một số phòng thí nghiệm đang nghiên cứu các phương pháp giảm chi phí hơn nữa, chẳng hạn như sử dụng RTX 5090/4090 thay vì H100 để đào tạo các mô hình học tăng cường. Cũng có một số tập trung vào việc sử dụng học tăng cường để nâng cao mức thông minh của các mô hình cơ sở lớn.

Dù trọng tâm nghiên cứu nằm ở đâu, nó sẽ trở thành một trong những hướng phát triển hứa hẹn nhất của AI phi tập trung. Nếu các giải pháp học tăng cường phi tập trung có thể được ứng dụng rộng rãi trong thương mại, khách hàng doanh nghiệp sẽ đầu tư một số tiền lớn vào AI và sẽ thấy nhiều đội ngũ AI phi tập trung đạt doanh thu hàng năm từ 8 đến 9 chữ số.

Cung cấp vốn cho DeAI và thực hiện mở rộng quy mô thông qua lớp phối hợp

Tuy nhiên, trước khi đạt được doanh thu từ 8 đến 9 con số mỗi năm, họ cần tiếp tục nghiên cứu, thực hiện và chuyển sang các giải pháp học tăng cường có tính khả thi thương mại, điều này đòi hỏi một lượng lớn vốn.

Một trong những cách tốt nhất để huy động vốn là thông qua các lớp điều phối như Bittensor. Mỗi ngày có hàng triệu đô la tiền thưởng TAO được phát cho các subnet (các công ty khởi nghiệp và phòng thí nghiệm AI), trong khi những người đóng góp (nhân tài AI) đóng góp cho các subnet mà họ quan tâm để nhận được một phần tiền thưởng.

Bittensor cho phép những người đóng góp tham gia vào sự phát triển AI, đồng thời cũng cho phép các nhà đầu tư đầu tư vào các phòng thí nghiệm AI đóng góp cho công nghệ DeAI.

Hiện tại trong hệ sinh thái Bittensor, có một vài lĩnh vực DeAI chính nổi bật, bao gồm tính toán lượng tử, đào tạo phi tập trung, đại lý AI và hệ thống dự đoán (học củng cố hiện tại chưa phải là một trong số đó, nhưng có hơn 3 subnet đang tích cực chú ý đến học củng cố phi tập trung).

Hiện tại tiến triển của học tập tăng cường phi tập trung như thế nào?

Học tăng cường đã được chứng minh là có thể được áp dụng quy mô lớn, nhưng vẫn chưa đạt được công nghiệp hóa. Tin tốt là nhu cầu của doanh nghiệp đối với các đại lý AI có khả năng học hỏi từ phản hồi thực tế đang tăng nhanh. Chẳng hạn như các đại lý có khả năng học hỏi từ môi trường thực tế, doanh số và cuộc gọi dịch vụ khách hàng, cũng như các mô hình giao dịch có thể thích ứng với sự thay đổi của thị trường. Những hệ thống tự học này có thể tạo ra hoặc tiết kiệm cho doanh nghiệp hàng triệu đô la.

Công nghệ bảo mật cũng đang nổi lên. Việc ứng dụng công nghệ như Môi trường thực thi đáng tin cậy (TEE), mã hóa nhúng trong TEE và bảo mật khác biệt trong vòng lặp phản hồi giúp mã hóa và bảo vệ thông tin cá nhân, cho phép các ngành nhạy cảm như chăm sóc sức khỏe, tài chính, pháp lý duy trì tính tuân thủ trong khi sở hữu các đại lý AI tự học mạnh mẽ trong các lĩnh vực cụ thể.

Tiếp theo sẽ như thế nào?

Học tăng cường là lựa chọn không thể tốt hơn để tiếp tục làm cho AI trở nên thông minh hơn. Học tăng cường chuyển AI từ hệ thống tạo ra thành một đại lý AI chủ động và thông minh.

Sự kết hợp giữa quyền riêng tư và học tăng cường sẽ thúc đẩy doanh nghiệp thực sự áp dụng, cung cấp các giải pháp tuân thủ cho khách hàng.

Học tăng cường khiến “kinh tế đại lý” trở nên khả thi, đại lý mua tài nguyên tính toán, thương lượng lẫn nhau, cung cấp dịch vụ.

Do tính hiệu quả chi phí, học tăng cường phi tập trung sẽ trở thành phương pháp mặc định để mở rộng đào tạo học tăng cường.

Học tăng cường liên bang (Federated RL) sẽ xuất hiện, cho phép nhiều bên hợp tác học mà không cần chia sẻ dữ liệu nhạy cảm cục bộ, kết hợp bảo vệ quyền riêng tư và tự học, nâng cao đáng kể trình độ trí tuệ, đồng thời đáp ứng các yêu cầu tuân thủ.

Các bài viết liên quan: mã hóa AI đại tái cơ cấu: Virtuals mất giá, DeFAI và dự đoán AI giành thị phần.

TAO-0.87%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim