Hoje em dia, todos estão vendendo coisas, seja comida, abrigo, enciclopédias, produtos eletrônicos, aplicativos ou a mais recente IA.
No passado, eram vendidos itens práticos que atendiam às necessidades mais básicas da pirâmide de Maslow, hoje vendem-se sonhos e esperanças, embalados em uma aparência brilhante, especialmente no campo da encriptação e da IA.
A encriptação de produtos e infraestruturas de IA muitas vezes é difícil de entender, levando as equipas a usarem excessivamente jargão na comunicação, o que não consegue atrair os utilizadores.
Além disso, iniciar um verdadeiro laboratório de IA (não apenas uma embalagem simples) requer um grande investimento para financiar talentos, colaboradores, recursos computacionais e outros recursos necessários.
Os laboratórios de IA empresariais avançados podem custar milhões de dólares por ano. Se estiverem a investigar, treinar e otimizar modelos de IA de ponta, os custos podem ascender a centenas de milhões de dólares. O preço das GPUs do modelo H100 varia entre 25.000 e 40.000 dólares, enquanto as GPUs dos modelos mais recentes Blackwell B200 e GB200 custam entre 30.000 e 70.000 dólares. Treinar um modelo de ponta pode exigir milhares dessas GPUs.
Vantagens da AI descentralizada (DeAI): modelos pequenos + aprendizagem reforçada
Escolher um sistema descentralizado, ou seja, coordenar recursos computacionais em todo o mundo para treinar um único modelo, teoricamente pode reduzir significativamente os custos de GPU (economizando de 30% a 90%), pois você pode aproveitar a rede de GPUs ociosas globalmente. No entanto, na prática, coordenar essas GPUs e garantir que todas funcionem com alta qualidade é muito difícil. Portanto, atualmente não existe laboratório de IA descentralizado capaz de resolver o problema do treinamento descentralizado.
No entanto, o futuro ainda é promissor, pois existem alguns laboratórios que obtiveram resultados encorajadores em aprendizado reforçado descentralizado. É justamente esse processo de auto-jogo e auto-aprendizagem que pode tornar um modelo pequeno extremamente inteligente.
Nem todas as situações requerem grandes modelos de linguagem (LLM). Treinar modelos específicos de domínio e usar aprendizado por reforço (RL) para aperfeiçoar e melhorar suas habilidades é a maneira mais econômica e eficaz de oferecer soluções de IA em nível empresarial, pois, no final das contas, o que os clientes desejam são resultados (conformidade, segurança, rentabilidade e aumento da produtividade).
Já em 2019, o OpenAI Five derrotou a equipe campeã mundial OG no Dota 2. Não foi sorte, mas sim uma verdadeira derrota esmagadora, vencendo a equipe OG em duas partidas consecutivas.
Você pode estar se perguntando como isso é feito?
“Dota 2” é um jogo de batalha em arena multijogador extremamente complexo, onde 5 jogadores se enfrentam, completando vários objetivos e destruindo a base do adversário.
Para que a IA possa competir com os melhores jogadores, seguiu os seguintes passos:
Começar do zero em auto-confronto: aprender conhecimentos básicos e realizar milhões de auto-confrontos. Se vencer, significa que a operação é favorável; se falhar, significa que a operação não é boa (ou seja, uma grande quantidade de tentativa e erro).
Configurar um sistema de recompensas (pontos) que incentive comportamentos com um valor esperado (EV) positivo que possam levar à vitória (como destruir torres de defesa, eliminar heróis) e penalize comportamentos com um valor esperado negativo.
O método de treinamento utiliza um algoritmo de aprendizado por reforço chamado “PPO”, onde a IA tenta certas operações durante a competição e o PPO considera os resultados como feedback. Se o resultado for bom, faz-se mais; se o resultado for ruim, faz-se menos. Este método gradualmente orienta a IA na direção certa.
Centenas de GPUs têm funcionado durante quase um ano para treinar IA, que está constantemente aprendendo e se adaptando às atualizações e mudanças de versão do jogo.
Após algum tempo, ele começou a explorar por conta própria estratégias complexas (sacrificando uma linha de soldados, adotando uma abordagem conservadora ou agressiva no momento adequado, aproveitando a oportunidade para um ataque em grande escala, etc.), e começou a competir contra jogadores humanos e a vencer.
Apesar de o OpenAI Five já ter sido desativado, ele inspirou modelos menores a serem extremamente eficazes em tarefas específicas (a quantidade de parâmetros do OpenAI Five é de apenas 58MB).
Laboratórios de IA de grande escala como a OpenAI conseguem fazer isso porque têm fundos e recursos para treinar modelos de aprendizagem por reforço. Se uma empresa quer ter seu próprio OpenAI Five para detecção de fraudes, robôs de fábrica, carros autónomos ou negociação em mercados financeiros, precisa de uma quantidade significativa de fundos para fazê-lo.
A encriptação descentralizada resolve este problema, e é por isso que laboratórios de IA descentralizados como Nous Research, Pluralis, gensyn, Prime Intellect e Gradient estão a construir uma rede global de GPU, treinando em conjunto modelos de encriptação para fornecer infraestrutura para IA específica de domínio empresarial.
Alguns laboratórios estão a investigar formas de reduzir ainda mais os custos, como usar RTX 5090/4090 em vez de H100 para treinar modelos de aprendizado por reforço. Há também alguns que se concentram em usar aprendizado por reforço para aumentar o nível de inteligência de grandes modelos de base.
Independentemente de onde esteja o foco da pesquisa, isso se tornará uma das direções de desenvolvimento mais promissoras para a encriptação AI descentralizada. Se soluções de aprendizado por reforço descentralizadas puderem ser aplicadas em larga escala comercialmente, os clientes empresariais investirão grandes quantias em encriptação AI e também verão mais equipes de encriptação AI descentralizadas alcançando receitas anuais de 8 a 9 dígitos.
fornece financiamento e realiza escalabilidade para DeAI através da camada de coordenação
No entanto, antes de alcançar uma receita de 8 a 9 dígitos por ano, eles precisam de pesquisa contínua, implementação e transição para soluções de aprendizagem reforçada com viabilidade comercial, o que requer um grande investimento.
Uma das melhores maneiras de angariar fundos é através de camadas de coordenação como a Bittensor. Todos os dias, milhões de dólares em incentivos TAO são distribuídos para sub-redes (startups e laboratórios de IA), enquanto os contribuintes (talentos em IA) contribuem para as sub-redes que os interessam, para obter uma parte dos incentivos.
Bittensor permite que os contribuidores participem no desenvolvimento de IA e também permite que os investidores invistam em laboratórios de IA que contribuem para a tecnologia DeAI.
Atualmente, no ecossistema Bittensor, há várias áreas-chave de DeAI que se destacam, incluindo computação quântica, treinamento descentralizado, agentes de IA e sistemas de previsão (aprendizado por reforço ainda não é um deles, mas há mais de 3 sub-redes que estão ativamente focadas em aprendizado por reforço descentralizado).
Como está o progresso da aprendizagem reforçada descentralizada atualmente?
A aprendizagem reforçada tem demonstrado ser aplicável em larga escala, mas ainda não foi industrializada. A boa notícia é que a demanda das empresas por agentes de IA que possam aprender com feedback real está a crescer rapidamente. Por exemplo, agentes que podem aprender a partir de ambientes reais, vendas e chamadas de serviço ao cliente, modelos de negociação que se adaptam às mudanças de mercado, etc. Esses sistemas de auto-aprendizagem podem criar ou economizar milhões de dólares para as empresas.
A tecnologia de privacidade também está em ascensão. O ambiente de execução confiável (TEE), a encriptação embutida dentro do TEE e a privacidade diferencial são tecnologias que, ao serem aplicadas em ciclos de feedback, ajudam a encriptar e proteger informações pessoais, permitindo que setores sensíveis como saúde, finanças e direito mantenham a conformidade enquanto possuem poderosos agentes de IA de autoaprendizagem em domínios específicos.
O que acontecerá a seguir?
O aprendizado por reforço é a escolha única para continuar tornando a IA mais inteligente. O aprendizado por reforço transforma a IA de um sistema gerador em um agente de IA proativo e inteligente.
A combinação de privacidade e aprendizado reforçado impulsionará as empresas a adotar realmente soluções que ofereçam conformidade para os clientes.
A aprendizagem reforçada torna possível a “economia de agentes”, onde os agentes compram recursos computacionais, negociam entre si e prestam serviços.
Devido à relação custo-benefício, a aprendizagem por reforço descentralizada tornará-se a forma padrão de expandir o treinamento de aprendizagem por reforço.
O Aprendizado por Reforço Federado (Federated RL) surgirá, permitindo que múltiplas partes aprendam de forma colaborativa sem compartilhar dados sensíveis locais, combinando proteção de privacidade com auto-aprendizado, aumentando significativamente o nível de inteligência, ao mesmo tempo que cumpre os requisitos de conformidade.
Leitura relacionada: encriptação AI em grande mudança: Virtuals perde popularidade, DeFAI e AI de previsão disputam o foco.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Como a DeAI compete com a IA centralizada: vantagens, aplicações e financiamento
Autor: 0xJeff, encriptação KOL
Compilado por: Felix, PANews
Hoje em dia, todos estão vendendo coisas, seja comida, abrigo, enciclopédias, produtos eletrônicos, aplicativos ou a mais recente IA.
No passado, eram vendidos itens práticos que atendiam às necessidades mais básicas da pirâmide de Maslow, hoje vendem-se sonhos e esperanças, embalados em uma aparência brilhante, especialmente no campo da encriptação e da IA.
A encriptação de produtos e infraestruturas de IA muitas vezes é difícil de entender, levando as equipas a usarem excessivamente jargão na comunicação, o que não consegue atrair os utilizadores.
Além disso, iniciar um verdadeiro laboratório de IA (não apenas uma embalagem simples) requer um grande investimento para financiar talentos, colaboradores, recursos computacionais e outros recursos necessários.
Os laboratórios de IA empresariais avançados podem custar milhões de dólares por ano. Se estiverem a investigar, treinar e otimizar modelos de IA de ponta, os custos podem ascender a centenas de milhões de dólares. O preço das GPUs do modelo H100 varia entre 25.000 e 40.000 dólares, enquanto as GPUs dos modelos mais recentes Blackwell B200 e GB200 custam entre 30.000 e 70.000 dólares. Treinar um modelo de ponta pode exigir milhares dessas GPUs.
Vantagens da AI descentralizada (DeAI): modelos pequenos + aprendizagem reforçada
Escolher um sistema descentralizado, ou seja, coordenar recursos computacionais em todo o mundo para treinar um único modelo, teoricamente pode reduzir significativamente os custos de GPU (economizando de 30% a 90%), pois você pode aproveitar a rede de GPUs ociosas globalmente. No entanto, na prática, coordenar essas GPUs e garantir que todas funcionem com alta qualidade é muito difícil. Portanto, atualmente não existe laboratório de IA descentralizado capaz de resolver o problema do treinamento descentralizado.
No entanto, o futuro ainda é promissor, pois existem alguns laboratórios que obtiveram resultados encorajadores em aprendizado reforçado descentralizado. É justamente esse processo de auto-jogo e auto-aprendizagem que pode tornar um modelo pequeno extremamente inteligente.
Nem todas as situações requerem grandes modelos de linguagem (LLM). Treinar modelos específicos de domínio e usar aprendizado por reforço (RL) para aperfeiçoar e melhorar suas habilidades é a maneira mais econômica e eficaz de oferecer soluções de IA em nível empresarial, pois, no final das contas, o que os clientes desejam são resultados (conformidade, segurança, rentabilidade e aumento da produtividade).
Já em 2019, o OpenAI Five derrotou a equipe campeã mundial OG no Dota 2. Não foi sorte, mas sim uma verdadeira derrota esmagadora, vencendo a equipe OG em duas partidas consecutivas.
Você pode estar se perguntando como isso é feito?
“Dota 2” é um jogo de batalha em arena multijogador extremamente complexo, onde 5 jogadores se enfrentam, completando vários objetivos e destruindo a base do adversário.
Para que a IA possa competir com os melhores jogadores, seguiu os seguintes passos:
Apesar de o OpenAI Five já ter sido desativado, ele inspirou modelos menores a serem extremamente eficazes em tarefas específicas (a quantidade de parâmetros do OpenAI Five é de apenas 58MB).
Laboratórios de IA de grande escala como a OpenAI conseguem fazer isso porque têm fundos e recursos para treinar modelos de aprendizagem por reforço. Se uma empresa quer ter seu próprio OpenAI Five para detecção de fraudes, robôs de fábrica, carros autónomos ou negociação em mercados financeiros, precisa de uma quantidade significativa de fundos para fazê-lo.
A encriptação descentralizada resolve este problema, e é por isso que laboratórios de IA descentralizados como Nous Research, Pluralis, gensyn, Prime Intellect e Gradient estão a construir uma rede global de GPU, treinando em conjunto modelos de encriptação para fornecer infraestrutura para IA específica de domínio empresarial.
Alguns laboratórios estão a investigar formas de reduzir ainda mais os custos, como usar RTX 5090/4090 em vez de H100 para treinar modelos de aprendizado por reforço. Há também alguns que se concentram em usar aprendizado por reforço para aumentar o nível de inteligência de grandes modelos de base.
Independentemente de onde esteja o foco da pesquisa, isso se tornará uma das direções de desenvolvimento mais promissoras para a encriptação AI descentralizada. Se soluções de aprendizado por reforço descentralizadas puderem ser aplicadas em larga escala comercialmente, os clientes empresariais investirão grandes quantias em encriptação AI e também verão mais equipes de encriptação AI descentralizadas alcançando receitas anuais de 8 a 9 dígitos.
fornece financiamento e realiza escalabilidade para DeAI através da camada de coordenação
No entanto, antes de alcançar uma receita de 8 a 9 dígitos por ano, eles precisam de pesquisa contínua, implementação e transição para soluções de aprendizagem reforçada com viabilidade comercial, o que requer um grande investimento.
Uma das melhores maneiras de angariar fundos é através de camadas de coordenação como a Bittensor. Todos os dias, milhões de dólares em incentivos TAO são distribuídos para sub-redes (startups e laboratórios de IA), enquanto os contribuintes (talentos em IA) contribuem para as sub-redes que os interessam, para obter uma parte dos incentivos.
Bittensor permite que os contribuidores participem no desenvolvimento de IA e também permite que os investidores invistam em laboratórios de IA que contribuem para a tecnologia DeAI.
Atualmente, no ecossistema Bittensor, há várias áreas-chave de DeAI que se destacam, incluindo computação quântica, treinamento descentralizado, agentes de IA e sistemas de previsão (aprendizado por reforço ainda não é um deles, mas há mais de 3 sub-redes que estão ativamente focadas em aprendizado por reforço descentralizado).
Como está o progresso da aprendizagem reforçada descentralizada atualmente?
A aprendizagem reforçada tem demonstrado ser aplicável em larga escala, mas ainda não foi industrializada. A boa notícia é que a demanda das empresas por agentes de IA que possam aprender com feedback real está a crescer rapidamente. Por exemplo, agentes que podem aprender a partir de ambientes reais, vendas e chamadas de serviço ao cliente, modelos de negociação que se adaptam às mudanças de mercado, etc. Esses sistemas de auto-aprendizagem podem criar ou economizar milhões de dólares para as empresas.
A tecnologia de privacidade também está em ascensão. O ambiente de execução confiável (TEE), a encriptação embutida dentro do TEE e a privacidade diferencial são tecnologias que, ao serem aplicadas em ciclos de feedback, ajudam a encriptar e proteger informações pessoais, permitindo que setores sensíveis como saúde, finanças e direito mantenham a conformidade enquanto possuem poderosos agentes de IA de autoaprendizagem em domínios específicos.
O que acontecerá a seguir?
O aprendizado por reforço é a escolha única para continuar tornando a IA mais inteligente. O aprendizado por reforço transforma a IA de um sistema gerador em um agente de IA proativo e inteligente.
A combinação de privacidade e aprendizado reforçado impulsionará as empresas a adotar realmente soluções que ofereçam conformidade para os clientes.
A aprendizagem reforçada torna possível a “economia de agentes”, onde os agentes compram recursos computacionais, negociam entre si e prestam serviços.
Devido à relação custo-benefício, a aprendizagem por reforço descentralizada tornará-se a forma padrão de expandir o treinamento de aprendizagem por reforço.
O Aprendizado por Reforço Federado (Federated RL) surgirá, permitindo que múltiplas partes aprendam de forma colaborativa sem compartilhar dados sensíveis locais, combinando proteção de privacidade com auto-aprendizado, aumentando significativamente o nível de inteligência, ao mesmo tempo que cumpre os requisitos de conformidade.
Leitura relacionada: encriptação AI em grande mudança: Virtuals perde popularidade, DeFAI e AI de previsão disputam o foco.