CEO da Google DeepMind: A AGI ainda está a 5 a 10 anos de distância, e as oportunidades e riscos de desenvolvimento de IA andam de mãos dadas

No final da “AI+SF Summit” realizada pela Axios em São Francisco, Demis Hassabis, CEO da Google DeepMind, apresentou as direções de investigação da DeepMind, avanços tecnológicos como modelos multimodais e mundiais, e discutiu o desenvolvimento de agentes de IA e os riscos relacionados. Avaliou também a competição de IA entre os Estados Unidos e a China, e deu uma estimativa rara do cronograma da AGI, acreditando que ainda faltam cerca de 5 a 10 anos para “sistemas de IA com capacidades cognitivas humanas”.

Com a bênção da aura Nobel, o pensamento cientista domina a DeepMind

No início do evento, o apresentador Mike Allen apresentou Hassabis como um prodígio do xadrez de 5 anos e um vencedor do Prémio Nobel de 48 anos. Hassabis admite que ganhar o prémio ainda parece super irreal, mas o impacto real é óbvio.

Porque quando fala com funcionários do governo ou decisores transfronteiriços que não estão familiarizados com IA, o “Prémio Nobel” é como uma chave que pode abrir rapidamente qualquer porta, tornando-os mais dispostos a ouvi-lo falar sobre questões como segurança e uso responsável da IA, e ele planeia fazer um uso mais ativo deste título no futuro.

No que diz respeito ao seu trabalho diário e estilo de gestão, Hassabis enfatiza que ele “vem sempre em primeiro lugar como cientista e CEO vem em segundo lugar.” Aos seus olhos, o método científico é uma das invenções mais importantes da humanidade, e ele aplica diretamente o processo de “formular hipóteses, desenhar experiências e atualizar opiniões com base nos resultados” ao desenvolvimento de produtos e à gestão organizacional.

As vantagens do DeepMind vêm de três níveis ao mesmo tempo, nomeadamente “investigação de classe mundial, capacidades de engenharia de classe mundial e infraestrutura informática de classe mundial”. Ele acredita que só quando estes três níveis forem realizados simultaneamente é que a DeepMind pode estar qualificada para estar na vanguarda do desenvolvimento da IA.

Disposição para os próximos 12 meses: evolução multimodal, modelo mundial e agentes

Falando sobre o progresso específico da IA nos próximos 12 meses, Hassabis salientou que o Gemini foi concebido desde o início como um modelo multimodal, capaz de processar texto, imagens, vídeo e áudio ao mesmo tempo. Por exemplo, o seu modelo de imagem mais recente, “Nano Banana Pro”, consegue produzir infográficos muito precisos, indicando que as capacidades de compreensão visual do modelo estão a melhorar rapidamente.

O segundo foco é o modelo mundial (World Models). O Genie 3, desenvolvido pela DeepMind, pode gerar vídeos interativos que permitem aos utilizadores não só ver o vídeo, mas também entrar no ecrã como se estivessem a entrar num jogo, mantendo consistência e coerência no mundo durante cerca de um minuto. Este tipo de modelo é visto como um passo fundamental na compreensão da IA sobre aparências e regras do mundo real.

O terceiro são os agentes de IA. Hassabis admitiu que os atuais agentes de IA não podem sentir-se aliviados por lhe entregar um pacote inteiro de tarefas diretamente, garantindo que tudo é bem feito do zero. Mas espera que, dentro de um ano, a confiança dos agentes de IA aumente definitivamente. O objetivo da Google é fazer do Gemini um “assistente universal” que não só exista em telemóveis e computadores, mas que possa estar ao lado do utilizador a qualquer momento através de dispositivos vestíveis como óculos, tornando-se um assistente regular para o dia a dia e para o trabalho.

( teste: O Gemini 3 Nano Banana Pro gera automaticamente cartoons humorísticos depois de pensar, transformando Trump novamente numa pequena )

O futuro é promissor para a exploração cósmica, mas os riscos de segurança são tão críticos quanto a compreensão em vídeo

Falando dos melhores cenários que a IA pode trazer, Hassabis levanta a hipótese de que a IA pode ajudar a humanidade a ultrapassar vários gargalos-chave, como a fusão nuclear ou novas baterias, novos avanços na ciência dos materiais e semicondutores, e soluções para doenças graves, e que a sociedade humana terá a oportunidade de avançar para a exploração espacial com recursos mais abundantes.

Mas também apontou o pior cenário possível, que se divide em vários níveis:

Atores maliciosos usam IA para desenhar ou melhorar patogénios.

A IA acelera ciberataques de forças estrangeiras a infraestruturas críticas como recursos energéticos e hídricos, e é provável que tais situações estejam a acontecer, mas a IA utilizada ainda não é avançada.

Agentes de IA altamente autónomos desviam-se das suas instruções originais e das expectativas humanas, pelo que têm de investir consideráveis recursos e atenção para os prevenir.

Em termos de capacidade, ele acredita que a parte subestimada do mundo exterior é o profundo entendimento da IA sobre vídeo. Hassabis partilhou que uma vez pediu a Gemini para analisar a cena, e o modelo não só compreende a imagem, como também oferece uma interpretação muito profunda dos símbolos e emoções, em vez de apenas descrever ações superficiais.

Mencionou ainda que o Gemini Live permite obter assistência instantânea para reparações apontando a câmara do telemóvel para equipamentos mecânicos, mas acredita que o veículo verdadeiramente ideal serão os óculos, porque as mãos devem estar vazias durante as operações no local para trabalhar e interagir com a IA ao mesmo tempo.

Restam apenas alguns meses na diferença entre os Estados Unidos e a China, e a AGI ainda está a uma ou duas milhas de distância

No que diz respeito à concorrência internacional, a Hassabis acredita que os Estados Unidos e o Ocidente continuam a liderar a China como um todo em termos de capacidades de modelos e inovação, mas o último lote de modelos da China, como o DeepSeek, já é muito forte e a maioria está a recuperar rapidamente com base nas tecnologias existentes. Ele julgou que, no passado, os Estados Unidos e o Ocidente podem ter liderado em anos, mas agora faltam apenas alguns meses para a China.

Hassabis define a AGI de forma bastante clara, nomeadamente:

“Deves ter todas as principais capacidades cognitivas dos seres humanos, incluindo planeamento a longo prazo, memória a longo prazo, aprendizagem contínua, raciocínio real e criatividade, etc.”

Salientou que, embora os LLMs nesta fase já tenham capacidade para abordar os melhores médicos em algumas áreas, continuarão a cometer erros em muitos cenários, e ainda existe uma lacuna entre a AGI verdadeira e a estimativa que demore entre 5 a 10 anos. Hassabis acrescentou que, mesmo que a escala dos LLMs existentes seja levada ao limite, ainda não é suficiente para ultrapassar o limiar da AGI, e o campo da IA poderá precisar de uma ou duas grandes descobertas tecnológicas que melhorem significativamente as capacidades, como os transformadores, antes de haver uma hipótese de alcançar verdadeiramente a AGI.

(IBM CEO: A indústria da IA é uma aposta “difícil de recuperar”, com os LLMs a terem apenas 1% de hipótese de criar ) AGI com sucesso

O artigo Google DeepMind CEO: A AGI está a 5 a 10 anos de distância, oportunidades e riscos de desenvolvimento de IA andam de mãos dadas apareceu primeiro no Chain News ABMedia.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)