Pindai untuk Mengunduh Aplikasi Gate
qrCode
Opsi Unduhan Lainnya
Jangan ingatkan saya lagi hari ini

Bagaimana DeAI bersaing dengan AI terpusat: keunggulan, aplikasi, dan pendanaan

Penulis: 0xJeff, enkripsi KOL

Kompilasi: Felix, PANews

Saat ini semua orang menjual sesuatu, baik itu makanan, tempat tinggal, ensiklopedia, produk elektronik, aplikasi, atau AI terbaru.

Dulu, yang dijual adalah barang-barang praktis yang memenuhi tingkat kebutuhan Maslow yang lebih rendah, kini yang dijual adalah mimpi dan harapan, dan dikemas dalam kemasan yang menarik, terutama di bidang enkripsi AI.

Produk dan infrastruktur enkripsi AI sering kali sulit dipahami, menyebabkan tim menggunakan terlalu banyak istilah teknis dalam komunikasi, sehingga tidak dapat menarik pengguna.

Selain itu, meluncurkan laboratorium AI yang sebenarnya (bukan sekadar pengemasan sederhana) memerlukan banyak dana untuk mendanai talenta, kontributor, sumber daya komputasi, dan sumber daya penting lainnya.

Laboratorium AI tingkat perusahaan yang canggih dapat menelan biaya hingga jutaan dolar setiap tahun. Jika sedang melakukan penelitian, pelatihan, dan pengoptimalan model AI terdepan, biayanya bisa mencapai ratusan juta dolar. Harga GPU model H100 berkisar antara 25.000 hingga 40.000 dolar, sedangkan harga GPU model Blackwell B200 dan GB200 yang lebih baru berkisar antara 30.000 hingga 70.000 dolar. Melatih sebuah model terdepan mungkin memerlukan ribuan GPU seperti itu.

Keuntungan AI Terdesentralisasi (DeAI): model kecil + pembelajaran penguatan

Memilih sistem terdesentralisasi, yaitu mengoordinasikan sumber daya komputasi secara global untuk melatih model tunggal, secara teori dapat secara signifikan mengurangi biaya GPU (menghemat 30% hingga 90%), karena Anda dapat memanfaatkan jaringan GPU yang tidak terpakai di seluruh dunia. Namun, pada kenyataannya, mengoordinasikan GPU ini dan memastikan semuanya dapat berfungsi dengan kualitas tinggi sangatlah sulit. Oleh karena itu, saat ini tidak ada laboratorium AI terdesentralisasi yang dapat mengatasi tantangan pelatihan terdesentralisasi.

Namun, masa depan tetap memiliki harapan, karena ada beberapa laboratorium yang telah mencapai hasil yang menggembirakan dalam pembelajaran penguatan terdesentralisasi. Proses permainan sendiri dan pembelajaran sendiri inilah yang dapat membuat model kecil menjadi sangat cerdas.

Tidak semua situasi memerlukan model bahasa besar (LLM). Melatih model di bidang tertentu dan menggunakan pembelajaran penguatan (RL) untuk menyempurnakan dan meningkatkan keterampilan mereka adalah cara yang paling ekonomis dan efektif untuk menyediakan solusi AI tingkat perusahaan, karena pada akhirnya, yang diinginkan pelanggan adalah hasil (kompatibilitas, keamanan, biaya-efektif, dan dapat meningkatkan produktivitas).

Pada tahun 2019, OpenAI Five mengalahkan tim juara dunia saat itu, OG, dalam permainan “Dota 2”. Ini bukan kebetulan, tetapi benar-benar sebuah penghancuran, mengalahkan tim OG dalam dua pertandingan berturut-turut.

Anda mungkin penasaran bagaimana ini dilakukan?

“Dota 2” adalah permainan arena pertempuran online multipemain yang sangat kompleks, di mana 5 pemain saling bertarung, menyelesaikan berbagai tujuan, dan menghancurkan markas lawan.

Untuk memungkinkan AI bersaing dengan pemain terbaik, ia mengikuti langkah-langkah berikut:

  • Mulai dari nol dengan bertarung melawan diri sendiri: pelajari pengetahuan dasar dan lakukan jutaan pertarungan melawan diri sendiri. Jika menang, itu berarti operasinya menguntungkan; jika kalah, itu berarti operasinya tidak baik (yaitu kesalahan yang ditoleransi dalam skala besar).
  • Mengatur sistem hadiah (point), mendorong perilaku yang mungkin membawa nilai harapan (EV) positif (seperti menghancurkan menara pertahanan, membunuh pahlawan), dan memberikan skor negatif untuk perilaku yang memiliki nilai harapan negatif.
  • Metode pelatihan menggunakan algoritma pembelajaran penguatan yang disebut “PPO”, AI mencoba beberapa tindakan dalam pertandingan, dan PPO menganggap hasilnya sebagai umpan balik. Jika hasilnya baik, lakukan lebih banyak; jika hasilnya buruk, lakukan lebih sedikit. Cara ini secara bertahap mengarahkan AI ke arah yang benar.
  • Ratusan GPU menjalankan pelatihan AI selama hampir satu tahun, AI terus belajar dan beradaptasi dengan pembaruan dan perubahan versi game.
  • Setelah beberapa waktu, ia mulai mengeksplorasi strategi kompleks secara mandiri (mengorbankan satu jalur pion, mengambil pendekatan konservatif atau agresif pada waktu yang tepat, dan memanfaatkan momen untuk serangan besar, dll), dan mulai melawan pemain manusia dan memenangkan.

Meskipun OpenAI Five telah dipensiunkan, itu menginspirasi bahwa model kecil dapat sangat efektif dalam tugas-tugas di bidang tertentu (jumlah parameter OpenAI Five hanya 58MB).

Laboratorium AI besar seperti OpenAI dapat melakukan ini karena memiliki dana dan sumber daya untuk melatih model pembelajaran penguatan. Jika sebuah perusahaan ingin memiliki OpenAI Five sendiri untuk deteksi penipuan, robot pabrik, mobil otonom, atau perdagangan pasar keuangan, diperlukan dana yang besar untuk melakukannya.

Pembelajaran penguatan terdesentralisasi menyelesaikan masalah ini, itulah sebabnya laboratorium AI terdesentralisasi seperti Nous Research, Pluralis, gensyn, Prime Intellect, dan Gradient sedang membangun jaringan GPU global untuk bersama-sama melatih model pembelajaran penguatan, menyediakan infrastruktur untuk AI spesifik domain tingkat perusahaan.

Beberapa laboratorium sedang meneliti cara untuk lebih menurunkan biaya, seperti menggunakan RTX 5090/4090 alih-alih H100 untuk melatih model pembelajaran penguatan. Ada juga yang fokus pada penggunaan pembelajaran penguatan untuk meningkatkan tingkat kecerdasan model dasar besar.

Apapun fokus penelitian, itu akan menjadi salah satu arah pengembangan paling menjanjikan untuk AI terdesentralisasi. Jika solusi pembelajaran penguatan terdesentralisasi dapat diterapkan secara luas dalam bisnis, klien perusahaan akan menginvestasikan banyak uang ke dalam AI, dan kita juga akan melihat lebih banyak tim AI terdesentralisasi yang mencapai pendapatan tahunan 8 hingga 9 digit.

Melalui lapisan koordinasi untuk memberikan dana kepada DeAI dan mencapai skala yang lebih besar

Namun, sebelum mencapai pendapatan tahunan 8 hingga 9 digit, mereka perlu terus melakukan penelitian, menerapkan, dan beralih ke solusi pembelajaran penguatan yang memiliki kelayakan bisnis, yang membutuhkan banyak dana.

Salah satu cara terbaik untuk mengumpulkan dana adalah melalui lapisan koordinasi seperti Bittensor. Setiap hari, jutaan dolar dalam bentuk insentif TAO diberikan kepada subnet (perusahaan rintisan dan laboratorium AI), sementara kontributor (talenta AI) berkontribusi pada subnet yang mereka minati untuk mendapatkan sebagian dari insentif tersebut.

Bittensor memungkinkan kontributor untuk berpartisipasi dalam pengembangan AI, serta memungkinkan investor untuk berinvestasi di laboratorium AI yang berkontribusi pada teknologi DeAI.

Saat ini, ada beberapa bidang DeAI kunci yang menonjol dalam ekosistem Bittensor, termasuk komputasi kuantum, pelatihan terdesentralisasi, agen AI, dan sistem prediksi (pembelajaran penguatan saat ini masih bukan salah satunya, tetapi ada lebih dari 3 subnet yang secara aktif memperhatikan pembelajaran penguatan terdesentralisasi).

Bagaimana perkembangan pembelajaran penguatan terdesentralisasi saat ini?

Pembelajaran penguatan telah terbukti dapat diterapkan secara besar-besaran, tetapi belum diindustrialisasi. Kabar baiknya adalah bahwa permintaan perusahaan terhadap agen AI yang dapat belajar dari umpan balik nyata sedang meningkat pesat. Misalnya, agen yang dapat belajar dari lingkungan nyata, penjualan, dan panggilan layanan pelanggan, serta model perdagangan yang dapat beradaptasi dengan perubahan pasar. Sistem pembelajaran mandiri ini dapat menciptakan atau menghemat jutaan dolar untuk perusahaan.

Teknologi privasi juga sedang berkembang. Penggunaan lingkungan eksekusi yang tepercaya (TEE), enkripsi yang terintegrasi dalam TEE, serta privasi diferensial dalam siklus umpan balik membantu mengenkripsi dan melindungi informasi pribadi, memungkinkan industri sensitif seperti kesehatan, keuangan, dan hukum untuk tetap mematuhi sambil memiliki agen AI pembelajaran mandiri yang kuat di domain tertentu.

Apa yang akan terjadi selanjutnya?

Pembelajaran penguatan adalah pilihan terbaik untuk membuat AI semakin cerdas. Pembelajaran penguatan mengubah AI dari sistem generatif menjadi agen AI yang proaktif dan cerdas.

Penggabungan privasi dan pembelajaran penguatan akan mendorong perusahaan untuk benar-benar mengadopsi solusi yang mematuhi bagi pelanggan.

Pembelajaran penguatan memungkinkan “ekonomi agen” untuk menjadi mungkin, agen membeli sumber daya komputasi, bernegosiasi satu sama lain, dan menyediakan layanan.

Karena efisiensi biaya, pembelajaran penguatan terdesentralisasi akan menjadi cara default untuk memperluas pelatihan pembelajaran penguatan.

Pembelajaran penguatan federasi (Federated RL) akan muncul, memungkinkan banyak pihak untuk belajar secara kolaboratif tanpa membagikan data sensitif lokal, menggabungkan perlindungan privasi dengan pembelajaran mandiri, secara signifikan meningkatkan tingkat kecerdasan, sekaligus memenuhi persyaratan kepatuhan.

Bacaan Terkait: Enkripsi AI besar-besaran: Virtuals kehilangan daya tarik, DeFAI dan AI prediksi berebut peluang.

TAO-1.27%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)