Günümüzde herkes bir şeyler satıyor, ister yiyecek, barınma, ansiklopedi, elektronik ürünler, uygulamalar ya da son zamanların AI'sı olsun.
Geçmişte, Maslow'un ihtiyaçlar hiyerarşisinin daha düşük seviyelerinde yer alan pratik ürünler satılıyordu, şimdi ise hayaller ve umutlar satılmakta ve bunlar özellikle şifreleme AI alanında göz alıcı bir ambalajla sunulmakta.
Şifreleme AI ürünleri ve altyapısı genellikle anlaşılması zor olduğundan, ekiplerin iletişimde fazla teknik terim kullanmasına ve kullanıcıları çekememesine neden olur.
Ayrıca, gerçek bir AI laboratuvarını (basit bir paketleme değil) başlatmak, yetenekler, katkıda bulunanlar, hesaplama kaynakları ve diğer gerekli kaynaklar için büyük miktarda fon gerektirir.
Gelişmiş kurumsal AI laboratuvarlarının yıllık maliyeti milyonlarca dolara kadar çıkabilir. Sınır AI modellerini araştırmak, eğitmek ve optimize etmek söz konusu olduğunda, maliyetler yüz milyonlarca dolara ulaşabilir. H100 modeli GPU'ların fiyatı 25.000 ile 40.000 dolar arasında değişirken, daha yeni Blackwell B200 ve GB200 modeli GPU'ların fiyatı 30.000 ile 70.000 dolar arasında bulunmaktadır. Bir sınır modeli eğitmek için binlerce bu tür GPU'ya ihtiyaç duyulabilir.
Merkeziyetsiz AI (DeAI) avantajları: Küçük modeller + Pekiştirmeli öğrenme
Merkeziyetsiz bir sistem seçmek, dünya genelinde hesaplama kaynaklarını tek bir modeli eğitmek için koordine etmek, teorik olarak GPU maliyetlerini büyük ölçüde (yüzde 30'dan yüzde 90'a kadar) azaltabilir, çünkü dünya genelindeki boşta olan GPU ağından yararlanabilirsiniz. Ancak, aslında bu GPU'ları koordine etmek ve hepsinin yüksek kaliteli çalışmasını sağlamak oldukça zordur. Bu nedenle, şu anda merkeziyetsiz eğitim sorununu aşabilecek bir merkeziyetsiz AI laboratuvarı yoktur.
Ancak gelecekte hala umut var, çünkü birkaç laboratuvar merkeziyetsiz güçlendirilmiş öğrenme konusunda cesaret verici sonuçlar elde etti. İşte bu kendine oyun oynama, kendine öğrenme süreci, küçük bir modeli son derece zeki hale getirebilir.
Her durumda büyük dil modellerine (LLM) ihtiyaç yoktur. Belirli alanlara yönelik modeller eğitmek ve bunların yeteneklerini geliştirmek için pekiştirmeli öğrenme (RL) kullanmak, kurumsal düzeyde AI çözümleri sunmanın en ekonomik ve etkili yoludur, çünkü sonuç olarak müşterilerin istediği şey sonuçlardır (uygunluk, güvenlik, maliyet etkinliği ve verimliliği artırma).
2019 yılında, OpenAI Five, Dota 2'de o zamanın dünya şampiyonu OG takımını yendi. Bu bir şans değil, tamamen bir ezme eylemiydi; ardışık iki maçta OG takımını yendi.
Bunun nasıl yapıldığını merak ediyor olabilirsiniz?
Dota 2, 5 oyuncunun karşı karşıya geldiği ve çeşitli hedefleri tamamlayarak rakip üssünü yok etmeye çalıştığı son derece karmaşık bir çok oyunculu çevrimiçi savaş arenası oyunudur.
AI'nın üst düzey oyuncularla rekabet edebilmesi için aşağıdaki adımları izlemiştir:
Sıfırdan kendinle savaş: Temel bilgileri öğren, milyonlarca kez kendinle savaş. Kazanırsan, iyi bir işlem yaptığını gösterir; kaybedersen, kötü bir işlem yaptığını gösterir (yani büyük ölçekli deneme yanılma).
Ödül sistemi (puan) ayarlayın, olumlu beklenti (EV) sağlayabilecek davranışları (örneğin, kule yıkımı, kahraman öldürme) teşvik edin ve olumsuz beklenti olan davranışlardan puan düşün.
Eğitim yöntemi, “PPO” adlı bir pekiştirmeli öğrenme algoritması kullanmaktadır; AI, yarışmada belirli işlemleri denemekte, PPO sonuçları geri bildirim olarak değerlendirmektedir. Eğer sonuç iyi olursa, daha fazla yapar; eğer sonuç kötü olursa, daha az yapar. Bu yöntem, AI'yı yavaş yavaş doğru yöne yönlendirmektedir.
Yüzlerce GPU, neredeyse bir yıl boyunca AI'yi eğitmek için çalışıyor, AI sürekli olarak oyun sürüm güncellemelerine ve değişikliklere uyum sağlıyor.
Bir süre sonra, kendi kendine karmaşık stratejileri keşfetmeye başladı (bir hat feda etmek, uygun zamanda savunmacı veya saldırgan bir oyun tarzı benimsemek, büyük çaplı saldırı fırsatlarını değerlendirmek vb.) ve insan oyuncularla karşılaşmaya ve kazanmaya başladı.
OpenAI Five emekli olmuş olmasına rağmen, belirli alan görevlerinde küçük modellerin de son derece etkili olabileceğini göstermiştir (OpenAI Five'in parametre sayısı yalnızca 58MB'dir).
OpenAI gibi büyük AI laboratuvarlarının bunu yapabilmesinin nedeni, güçlendirme öğrenme modellerini eğitmek için gerekli finansman ve kaynaklara sahip olmalarıdır. Eğer bir işletme, dolandırıcılık tespiti, fabrika robotları, otonom araçlar veya finansal piyasa ticareti için kendi OpenAI Five'ına sahip olmak istiyorsa, bunu başarmak için büyük miktarda finansmana ihtiyaç vardır.
Merkeziyetsiz pekiştirmeli öğrenme bu sorunu çözdü, bu nedenle Nous Research, Pluralis, gensyn, Prime Intellect ve Gradient gibi merkeziyetsiz AI laboratuvarları, kurumsal düzeyde belirli alan AI için altyapı sağlamak amacıyla küresel bir GPU ağı inşa ediyor ve pekiştirmeli öğrenme modellerini ortaklaşa eğitiyor.
Bazı laboratuvarlar, güçlendirilmiş öğrenme modellerini eğitmek için H100 yerine RTX 5090/4090 kullanmak gibi maliyetleri daha da düşürmenin yollarını araştırıyor. Ayrıca, büyük temel modellerin zeka seviyelerini artırmak için güçlendirilmiş öğrenmeyi kullanmaya odaklananlar da var.
Araştırma odak noktası ne olursa olsun, merkeziyetsiz AI'nin en umut verici gelişim yönlerinden biri haline gelecektir. Eğer merkeziyetsiz pekiştirme öğrenimi çözümleri ticari olarak büyük ölçekte uygulanabilirse, kurumsal müşteriler AI'ye büyük miktarda yatırım yapacak ve daha fazla merkeziyetsiz AI ekibinin 8 ile 9 haneli yıllık gelir elde ettiğini görecektir.
DeAI'ye finansman sağlamak ve ölçeklenme gerçekleştirmek için koordinasyon katmanı aracılığıyla
Ancak, her yıl 8 ila 9 haneli bir gelire ulaşmadan önce, sürekli araştırma yapmaları, uygulamaları ve ticari olarak uygulanabilir pekiştirme öğrenme çözümlerine geçiş yapmaları gerekmektedir; bu da büyük miktarda finansman gerektirir.
Bittensor gibi bir koordinasyon katmanı aracılığıyla fon toplamak en iyi yollardan biridir. Her gün milyonlarca dolar değerinde TAO teşvikleri alt ağlara (girişimler ve AI laboratuvarları) dağıtılırken, katkıda bulunanlar (AI yetenekleri) ilgilendikleri alt ağlara katkıda bulunarak teşviklerin bir kısmını elde ederler.
Bittensor, katkıda bulunanların AI'nin geliştirilmesine katılmasını sağlar ve yatırımcıların DeAI teknolojisine katkıda bulunan AI laboratuvarlarına yatırım yapmalarına olanak tanır.
Şu anda Bittensor ekosisteminde, kuantum hesaplama, merkeziyetsiz eğitim, AI ajanları ve tahmin sistemleri (güçlendirme öğrenimi şu anda bunlardan biri değil, ancak 3'ten fazla alt ağ merkeziyetsiz güçlendirme öğrenimine aktif olarak odaklanıyor) dahil olmak üzere birkaç ana DeAI alt alanı öne çıkmaktadır.
Şu anda merkeziyetsiz güçlendirilmiş öğrenme ne durumda?
Güçlendirilmiş öğrenme büyük ölçekli uygulama için kanıtlanmış olsa da, henüz sanayileşme aşamasına ulaşmamıştır. İyi haber şu ki, gerçek geri bildirimlerden öğrenebilen AI ajanlarına olan talep hızla artmaktadır. Örneğin, gerçek ortamdan, satış ve müşteri hizmetleri telefonlarından öğrenebilen ajanlar, piyasa değişikliklerine uyum sağlayabilen ticaret modelleri gibi. Bu kendi kendine öğrenen sistemler, işletmelere milyonlarca dolar kazandırabilir veya tasarruf ettirebilir.
Gizlilik teknolojileri de yükselişte. Güvenilir yürütme ortamı (TEE), TEE içindeki şifreleme yerleşimi ve farklı gizlilik gibi teknolojilerin geri bildirim döngüsündeki uygulamaları, özel bilgilerin şifrelenmesine ve korunmasına yardımcı olur. Böylece sağlık hizmetleri, finans, hukuk gibi hassas sektörler, güçlü belirli alan öz öğrenen AI ajanlarına sahip olurken uyum sağlamaya devam edebilir.
Sonra ne olacak?
Pekiştirmeli öğrenme, AI'yı daha akıllı hale getirmek için en iyi seçimdir. Pekiştirmeli öğrenme, AI'yı üreten sistemlerden proaktif, akıllı AI ajanlarına dönüştürür.
Gizlilik ve pekiştirmeli öğrenmenin bir araya gelmesi, işletmelerin gerçekten benimsemesini teşvik edecek ve müşterilere uyumlu çözümler sunacaktır.
Güçlendirilmiş öğrenme, “temsilci ekonomisini” mümkün kılar; temsilciler hesaplama kaynakları satın alır, karşılıklı müzakere eder ve hizmet sunar.
Maliyet etkinliği nedeniyle, merkeziyetsiz güçlendirilmiş öğrenme, güçlendirilmiş öğrenme eğitimini ölçeklendirmenin varsayılan yolu haline gelecektir.
Federatif Pekiştirmeli Öğrenme (Federated RL) ortaya çıkacak, bu da birden fazla tarafın yerel hassas verileri paylaşmadan işbirliği içinde öğrenmesine olanak tanıyacak, gizlilik koruması ile kendi kendine öğrenmeyi birleştirerek zeka seviyesini büyük ölçüde artıracak ve aynı zamanda uyum gereksinimlerine uygun olacaktır.
İlgili Makaleler: Şifreleme AI büyük temizlik: Virtuals gözden düştü, DeFAI ve tahmin AI rüzgarı kapıyor
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
DeAI, merkezi AI ile nasıl rekabet eder: Avantajlar, uygulamalar ve finansman
Yazar: 0xJeff, şifreleme KOL
Derleme: Felix, PANews
Günümüzde herkes bir şeyler satıyor, ister yiyecek, barınma, ansiklopedi, elektronik ürünler, uygulamalar ya da son zamanların AI'sı olsun.
Geçmişte, Maslow'un ihtiyaçlar hiyerarşisinin daha düşük seviyelerinde yer alan pratik ürünler satılıyordu, şimdi ise hayaller ve umutlar satılmakta ve bunlar özellikle şifreleme AI alanında göz alıcı bir ambalajla sunulmakta.
Şifreleme AI ürünleri ve altyapısı genellikle anlaşılması zor olduğundan, ekiplerin iletişimde fazla teknik terim kullanmasına ve kullanıcıları çekememesine neden olur.
Ayrıca, gerçek bir AI laboratuvarını (basit bir paketleme değil) başlatmak, yetenekler, katkıda bulunanlar, hesaplama kaynakları ve diğer gerekli kaynaklar için büyük miktarda fon gerektirir.
Gelişmiş kurumsal AI laboratuvarlarının yıllık maliyeti milyonlarca dolara kadar çıkabilir. Sınır AI modellerini araştırmak, eğitmek ve optimize etmek söz konusu olduğunda, maliyetler yüz milyonlarca dolara ulaşabilir. H100 modeli GPU'ların fiyatı 25.000 ile 40.000 dolar arasında değişirken, daha yeni Blackwell B200 ve GB200 modeli GPU'ların fiyatı 30.000 ile 70.000 dolar arasında bulunmaktadır. Bir sınır modeli eğitmek için binlerce bu tür GPU'ya ihtiyaç duyulabilir.
Merkeziyetsiz AI (DeAI) avantajları: Küçük modeller + Pekiştirmeli öğrenme
Merkeziyetsiz bir sistem seçmek, dünya genelinde hesaplama kaynaklarını tek bir modeli eğitmek için koordine etmek, teorik olarak GPU maliyetlerini büyük ölçüde (yüzde 30'dan yüzde 90'a kadar) azaltabilir, çünkü dünya genelindeki boşta olan GPU ağından yararlanabilirsiniz. Ancak, aslında bu GPU'ları koordine etmek ve hepsinin yüksek kaliteli çalışmasını sağlamak oldukça zordur. Bu nedenle, şu anda merkeziyetsiz eğitim sorununu aşabilecek bir merkeziyetsiz AI laboratuvarı yoktur.
Ancak gelecekte hala umut var, çünkü birkaç laboratuvar merkeziyetsiz güçlendirilmiş öğrenme konusunda cesaret verici sonuçlar elde etti. İşte bu kendine oyun oynama, kendine öğrenme süreci, küçük bir modeli son derece zeki hale getirebilir.
Her durumda büyük dil modellerine (LLM) ihtiyaç yoktur. Belirli alanlara yönelik modeller eğitmek ve bunların yeteneklerini geliştirmek için pekiştirmeli öğrenme (RL) kullanmak, kurumsal düzeyde AI çözümleri sunmanın en ekonomik ve etkili yoludur, çünkü sonuç olarak müşterilerin istediği şey sonuçlardır (uygunluk, güvenlik, maliyet etkinliği ve verimliliği artırma).
2019 yılında, OpenAI Five, Dota 2'de o zamanın dünya şampiyonu OG takımını yendi. Bu bir şans değil, tamamen bir ezme eylemiydi; ardışık iki maçta OG takımını yendi.
Bunun nasıl yapıldığını merak ediyor olabilirsiniz?
Dota 2, 5 oyuncunun karşı karşıya geldiği ve çeşitli hedefleri tamamlayarak rakip üssünü yok etmeye çalıştığı son derece karmaşık bir çok oyunculu çevrimiçi savaş arenası oyunudur.
AI'nın üst düzey oyuncularla rekabet edebilmesi için aşağıdaki adımları izlemiştir:
OpenAI Five emekli olmuş olmasına rağmen, belirli alan görevlerinde küçük modellerin de son derece etkili olabileceğini göstermiştir (OpenAI Five'in parametre sayısı yalnızca 58MB'dir).
OpenAI gibi büyük AI laboratuvarlarının bunu yapabilmesinin nedeni, güçlendirme öğrenme modellerini eğitmek için gerekli finansman ve kaynaklara sahip olmalarıdır. Eğer bir işletme, dolandırıcılık tespiti, fabrika robotları, otonom araçlar veya finansal piyasa ticareti için kendi OpenAI Five'ına sahip olmak istiyorsa, bunu başarmak için büyük miktarda finansmana ihtiyaç vardır.
Merkeziyetsiz pekiştirmeli öğrenme bu sorunu çözdü, bu nedenle Nous Research, Pluralis, gensyn, Prime Intellect ve Gradient gibi merkeziyetsiz AI laboratuvarları, kurumsal düzeyde belirli alan AI için altyapı sağlamak amacıyla küresel bir GPU ağı inşa ediyor ve pekiştirmeli öğrenme modellerini ortaklaşa eğitiyor.
Bazı laboratuvarlar, güçlendirilmiş öğrenme modellerini eğitmek için H100 yerine RTX 5090/4090 kullanmak gibi maliyetleri daha da düşürmenin yollarını araştırıyor. Ayrıca, büyük temel modellerin zeka seviyelerini artırmak için güçlendirilmiş öğrenmeyi kullanmaya odaklananlar da var.
Araştırma odak noktası ne olursa olsun, merkeziyetsiz AI'nin en umut verici gelişim yönlerinden biri haline gelecektir. Eğer merkeziyetsiz pekiştirme öğrenimi çözümleri ticari olarak büyük ölçekte uygulanabilirse, kurumsal müşteriler AI'ye büyük miktarda yatırım yapacak ve daha fazla merkeziyetsiz AI ekibinin 8 ile 9 haneli yıllık gelir elde ettiğini görecektir.
DeAI'ye finansman sağlamak ve ölçeklenme gerçekleştirmek için koordinasyon katmanı aracılığıyla
Ancak, her yıl 8 ila 9 haneli bir gelire ulaşmadan önce, sürekli araştırma yapmaları, uygulamaları ve ticari olarak uygulanabilir pekiştirme öğrenme çözümlerine geçiş yapmaları gerekmektedir; bu da büyük miktarda finansman gerektirir.
Bittensor gibi bir koordinasyon katmanı aracılığıyla fon toplamak en iyi yollardan biridir. Her gün milyonlarca dolar değerinde TAO teşvikleri alt ağlara (girişimler ve AI laboratuvarları) dağıtılırken, katkıda bulunanlar (AI yetenekleri) ilgilendikleri alt ağlara katkıda bulunarak teşviklerin bir kısmını elde ederler.
Bittensor, katkıda bulunanların AI'nin geliştirilmesine katılmasını sağlar ve yatırımcıların DeAI teknolojisine katkıda bulunan AI laboratuvarlarına yatırım yapmalarına olanak tanır.
Şu anda Bittensor ekosisteminde, kuantum hesaplama, merkeziyetsiz eğitim, AI ajanları ve tahmin sistemleri (güçlendirme öğrenimi şu anda bunlardan biri değil, ancak 3'ten fazla alt ağ merkeziyetsiz güçlendirme öğrenimine aktif olarak odaklanıyor) dahil olmak üzere birkaç ana DeAI alt alanı öne çıkmaktadır.
Şu anda merkeziyetsiz güçlendirilmiş öğrenme ne durumda?
Güçlendirilmiş öğrenme büyük ölçekli uygulama için kanıtlanmış olsa da, henüz sanayileşme aşamasına ulaşmamıştır. İyi haber şu ki, gerçek geri bildirimlerden öğrenebilen AI ajanlarına olan talep hızla artmaktadır. Örneğin, gerçek ortamdan, satış ve müşteri hizmetleri telefonlarından öğrenebilen ajanlar, piyasa değişikliklerine uyum sağlayabilen ticaret modelleri gibi. Bu kendi kendine öğrenen sistemler, işletmelere milyonlarca dolar kazandırabilir veya tasarruf ettirebilir.
Gizlilik teknolojileri de yükselişte. Güvenilir yürütme ortamı (TEE), TEE içindeki şifreleme yerleşimi ve farklı gizlilik gibi teknolojilerin geri bildirim döngüsündeki uygulamaları, özel bilgilerin şifrelenmesine ve korunmasına yardımcı olur. Böylece sağlık hizmetleri, finans, hukuk gibi hassas sektörler, güçlü belirli alan öz öğrenen AI ajanlarına sahip olurken uyum sağlamaya devam edebilir.
Sonra ne olacak?
Pekiştirmeli öğrenme, AI'yı daha akıllı hale getirmek için en iyi seçimdir. Pekiştirmeli öğrenme, AI'yı üreten sistemlerden proaktif, akıllı AI ajanlarına dönüştürür.
Gizlilik ve pekiştirmeli öğrenmenin bir araya gelmesi, işletmelerin gerçekten benimsemesini teşvik edecek ve müşterilere uyumlu çözümler sunacaktır.
Güçlendirilmiş öğrenme, “temsilci ekonomisini” mümkün kılar; temsilciler hesaplama kaynakları satın alır, karşılıklı müzakere eder ve hizmet sunar.
Maliyet etkinliği nedeniyle, merkeziyetsiz güçlendirilmiş öğrenme, güçlendirilmiş öğrenme eğitimini ölçeklendirmenin varsayılan yolu haline gelecektir.
Federatif Pekiştirmeli Öğrenme (Federated RL) ortaya çıkacak, bu da birden fazla tarafın yerel hassas verileri paylaşmadan işbirliği içinde öğrenmesine olanak tanıyacak, gizlilik koruması ile kendi kendine öğrenmeyi birleştirerek zeka seviyesini büyük ölçüde artıracak ve aynı zamanda uyum gereksinimlerine uygun olacaktır.
İlgili Makaleler: Şifreleme AI büyük temizlik: Virtuals gözden düştü, DeFAI ve tahmin AI rüzgarı kapıyor