Скануйте, щоб завантажити додаток Gate
qrCode
Більше варіантів завантаження
Не нагадувати сьогодні

Як DeAI може конкурувати з централізованим ШІ: переваги, застосування та фінансування

Автор: 0xJeff, шифрування KOL

Комп'ютер: Felix, PANews

Сьогодні всі продають щось, будь то їжа, житло, енциклопедії, електронні продукти, програми або нещодавні AI.

В минулому продавали практичні речі, які задовольняли нижчі рівні потреб за теорією ієрархії потреб Маслоу, сьогодні ж продають мрії та надії, упаковуючи їх у яскраву обгортку, особливо в сфері шифрування AI.

Шифрування AI продукти та інфраструктура часто важко зрозуміти, що призводить до того, що команди використовують занадто багато спеціалізованої термінології під час спілкування, не в змозі залучити користувачів.

Крім того, запуск справжньої лабораторії штучного інтелекту (не просто просте упакування) потребує значних коштів для фінансування талантів, учасників, обчислювальних ресурсів та інших необхідних ресурсів.

Передові корпоративні лабораторії штучного інтелекту можуть коштувати до кількох мільйонів доларів на рік. Якщо мова йде про дослідження, навчання та оптимізацію передових моделей ШІ, витрати можуть сягати кількох сотень мільйонів доларів. Ціни на GPU моделі H100 коливаються від 25 до 40 тисяч доларів, тоді як новіші моделі GPU Blackwell B200 та GB200 мають ціну від 30 до 70 тисяч доларів. Навчання передової моделі може вимагати тисяч таких GPU.

Переваги децентралізованого ШІ (DeAI): малі моделі + підкріплене навчання

Вибір децентралізованої системи, тобто координація обчислювальних ресурсів у глобальному масштабі для навчання єдиної моделі, теоретично може значно знизити вартість GPU (зекономити від 30% до 90%), оскільки ви можете використовувати глобальну мережу незайнятих GPU. Але насправді координація цих GPU та забезпечення їх високоякісної роботи є дуже складним завданням. Тому наразі немає децентралізованих AI лабораторій, які змогли б подолати труднощі децентралізованого навчання.

Однак майбутнє все ж має надію, оскільки є кілька лабораторій, які досягли вражаючих результатів у децентралізованому посиленому навчанні. Саме цей процес самоігри та самонавчання може зробити невелику модель надзвичайно розумною.

Не всі ситуації потребують великих мовних моделей (LLM). Найефективніший і економічний спосіб надання рішень AI для підприємств – це навчити моделі для конкретних галузей і використовувати підкріплене навчання (RL) для вдосконалення та підвищення їхніх навичок, оскільки в кінцевому підсумку клієнти хочуть отримати результати (дотримання правил, безпека, висока рентабельність і підвищення продуктивності).

Ще в 2019 році OpenAI Five перемогла тодішніх світових чемпіонів команди OG у «Dota 2». Це не було випадковим успіхом, а повним розгромом, адже вони перемогли команду OG у двох поспіль матчах.

Ви, можливо, запитаєте, як це зроблено?

«Dota 2» — це надзвичайно складна гра в жанрі багатокористувацької онлайн-бойової арени, в якій 5 гравців змагаються один з одним, виконуючи різні цілі та знищуючи базу супротивника.

Щоб штучний інтелект міг протистояти топ-гравцям, він дотримувався таких кроків:

  • Починайте з нуля самостійні бої: вивчайте основи, проводьте мільйони самостійних боїв. Якщо ви виграєте, це означає, що операція була вигідною; якщо програєте, це означає, що операція не вдалася (тобто масове випробування помилок).
  • Налаштувати систему винагород (бали), що стимулює ті дії, які можуть принести позитивне очікуване значення (EV) (наприклад, знищення веж, вбивство героїв), а також знижувати бали за дії з негативним очікуваним значенням.
  • Метод навчання використовує алгоритм посилення навчання під назвою “PPO”, де ШІ пробує певні дії під час змагання, а PPO розглядає результати як зворотний зв'язок. Якщо результат хороший, то їх роблять більше; якщо результат поганий, то їх роблять менше. Цей підхід поступово веде ШІ в правильному напрямку.
  • Сотні GPU працюють близько року над навчанням ШИ, ШИ постійно вчиться та адаптується до оновлень версій і змін у грі.
  • Через деякий час він почав самостійно досліджувати складні стратегії (жертвуючи лінією, обираючи вірний момент для консервативної або агресивної гри, використовуючи можливості для масованого нападу тощо), і почав протистояти людським гравцям та перемагати.

Хоча OpenAI Five вже вийшов з експлуатації, він надихнув на те, що малі моделі можуть бути надзвичайно ефективними в завданнях у специфічних сферах (кількість параметрів OpenAI Five складає лише 58MB).

Причиною того, що великі лабораторії штучного інтелекту, такі як OpenAI, можуть це зробити, є наявність фінансування та ресурсів для навчання моделей посиленого навчання. Якщо компанія хоче мати свій власний OpenAI Five для виявлення шахрайства, роботів для заводів, автомобілів з автоматичним управлінням або торгівлі на фінансових ринках, їй потрібно значне фінансування для цього.

Децентралізоване посилене навчання вирішує цю проблему, саме тому такі децентралізовані AI лабораторії, як Nous Research, Pluralis, gensyn, Prime Intellect та Gradient, будують глобальну GPU мережу для спільного навчання посилених навчальних моделей, щоб забезпечити інфраструктуру для AI в специфічних галузях для підприємств.

Деякі лабораторії досліджують способи подальшого зниження витрат, наприклад, використовуючи RTX 5090/4090 замість H100 для навчання моделей посилювального навчання. Є також такі, що зосереджуються на використанні посилювального навчання для підвищення рівня інтелекту великих базових моделей.

Незалежно від того, на якому дослідженні зосереджено увагу, це стане одним з найбільш перспективних напрямків розвитку децентралізованого ШІ. Якщо рішення з децентралізованого підкріпленого навчання зможуть бути комерційно реалізовані в масштабах, підприємства-клієнти вкладуть значні кошти в ШІ, а також ми побачимо більше децентралізованих команд ШІ, які досягнуть річного доходу від 8 до 9 значних чисел.

за рахунок координаційного рівня забезпечує фінансування для DeAI та реалізує масштабування

Але перед тим, як досягти щорічного доходу від 8 до 9 цифр, їм потрібно постійно досліджувати, впроваджувати та переходити до комерційно життєздатних рішень у сфері посиленого навчання, що вимагатиме значних фінансових вкладень.

Збір коштів через координаційний рівень, такий як Bittensor, є одним із найкращих способів. Щодня мільйони доларів стимулів TAO виплачуються підмережам (стартапам та лабораторіям ШІ), тоді як учасники (таланти ШІ) вносять свій внесок у підмережі, які їх цікавлять, щоб отримати частину стимулів.

Bittensor дозволяє учасникам брати участь у розробці ШІ, а також дає можливість інвесторам інвестувати в лабораторії ШІ, які вносять внесок у технології DeAI.

В даний час в екосистемі Bittensor виділяються кілька ключових сегментів DeAI, включаючи квантові обчислення, децентралізоване навчання, AI-агенти та системи прогнозування (підкріплювальне навчання поки що не є одним з них, але є понад 3 підмережі, які активно цікавляться децентралізованим підкріплювальним навчанням).

Який прогрес у децентралізованому посиленому навчанні на даний момент?

Підкріплене навчання вже доведено, що може бути масштабно застосоване, але ще не досягнуто індустріалізації. Хороша новина полягає в тому, що попит підприємств на AI-агентів, які можуть навчатися з реальних відгуків, швидко зростає. Наприклад, агенти, які можуть навчатися з реального середовища, продажів і телефонних дзвінків служб підтримки клієнтів, а також торгові моделі, які можуть адаптуватися до змін на ринку. Ці системи самонавчання можуть створити або заощадити мільйони доларів для підприємств.

Технології конфіденційності також набирають популярності. Використання технологій, таких як довірене середовище виконання (TEE), вбудоване шифрування в TEE та диференційоване шифрування, у зворотному зв'язку допомагає зашифрувати та захистити приватну інформацію, дозволяючи чутливим галузям, таким як охорона здоров'я, фінанси та право, дотримуватися вимог при наявності потужних агентів штучного інтелекту з самоосвітою в конкретних сферах.

Що буде далі?

Поглиблене навчання є найкращим вибором для подальшого інтелекту AI. Поглиблене навчання перетворює AI з генеративної системи в активного, розумного агента AI.

Поєднання конфіденційності та підкріплювального навчання сприятиме реальному впровадженню компаніями, пропонуючи клієнтам рішення, що відповідають вимогам.

Посилене навчання зробило можливим “економіку агентів”, де агенти купують обчислювальні ресурси, ведуть взаємні переговори та надають послуги.

Через економічність, децентралізоване підкріплювальне навчання стане стандартним способом розширення навчання підкріплення.

Федеративне посилене навчання (Federated RL) з'явиться, що дозволить багатьом сторонам співпрацювати в навчанні без обміну локальними чутливими даними, поєднуючи захист конфіденційності з самоосвітою, що значно підвищить рівень інтелекту та відповідатиме вимогам регулювання.

Додаткова інформація: шифрування AI великий перетасування: Virtuals втрачають популярність, DeFAI та прогнозний AI захоплюють ринок

TAO-1.47%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити