Cómo la autoinvestigación de IA está redefiniendo los experimentos de codificación de IA y generando un debate sobre los sistemas que se mejoran a sí mismos...

2026-03-17 10:21:43

En las últimas semanas, un experimento viral de Andrej Karpathy ha convertido la autoresearch en IA de una idea de nicho a un tema central en la comunidad de investigación en IA.

Los orígenes del concepto de autoresearch de Karpathy

A principios de este mes, Andrej Karpathy, un destacado investigador de IA y uno de los empleados fundadores de OpenAI, compartió un experimento impactante en X. Posteriormente dirigió la IA en Tesla y ahora trabaja de forma independiente mientras dirige Eureka Labs, un proyecto que construye un nuevo tipo de escuela para la era de la IA.

Karpathy, que tiene 1.9 millones de seguidores en X, es lo suficientemente influyente como para que casi cualquier comentario sobre IA se difunda rápidamente. Sin embargo, esta última publicación destacó porque mostraba un sistema práctico que él construyó para investigación automatizada, al que llamó “autoresearch”. La idea rápidamente capturó la imaginación tanto de practicantes como de teóricos.

En el experimento, Karpathy desplegó un agente de codificación en IA para ejecutar una secuencia de pruebas destinadas a mejorar el entrenamiento de un modelo de lenguaje pequeño. Durante dos días consecutivos, el agente realizó 700 experimentos, explorando sistemáticamente configuraciones de entrenamiento para encontrar mejores ajustes.

A lo largo de esos experimentos, el agente descubrió 20 optimizaciones que mejoraron la eficiencia del entrenamiento. Además, cuando Karpathy aplicó los mismos 20 ajustes a un modelo de lenguaje más grande, aunque todavía relativamente pequeño, registró un aumento del 11% en la velocidad de entrenamiento. Esta ganancia concreta subrayó el potencial práctico de su enfoque.

De demostración en laboratorio a posible nuevo paradigma de investigación

Karpathy describió el marco como un motor de investigación general para la optimización de código y modelos. Es importante destacar que el agente de autoresearch no ajustaba su propio sistema, sino que modificaba el código de entrenamiento y los parámetros iniciales de una IA diferente, más pequeña. Esa distinción es relevante para las discusiones sobre seguridad, incluso si las implicaciones para los flujos de trabajo de investigación son profundas.

Argumentó que estas herramientas podrían transformar la forma en que los principales laboratorios realizan investigación en IA. “Todos los laboratorios de frontera en LLM harán esto. Es la batalla final,” escribió Karpathy en X. Sin embargo, reconoció que escalar la idea desde un proyecto de 630 líneas en Python hasta una base de código de un modelo de frontera, que es muchas veces más grande, introduce una complejidad significativa.

Karpathy aún enmarcó el desafío como un problema de ingeniería en lugar de una barrera conceptual. En su opinión, los laboratorios crearán un enjambre de agentes, los harán colaborar para ajustar modelos más pequeños y, luego, promoverán progresivamente las ideas más prometedoras a escalas mayores. Sugirió que los humanos “opcionalmente” contribuirán en los márgenes, guiando y evaluando en lugar de codificar manualmente cada modificación.

Actualmente, su implementación se centra en un solo agente que mejora iterativamente una base de código en un solo camino. Sin embargo, en el futuro, espera que múltiples agentes de IA exploren diferentes hipótesis y experimentos en paralelo. Escribió que el próximo paso para la autoresearch es convertirse en un entorno asincrónico y masivamente colaborativo para agentes, diseñado para emular una comunidad de investigación en lugar de un solo estudiante de doctorado.

Reacción de la industria y la prueba de Shopify

El experimento rápidamente dejó la teoría cuando Tobias Lütke, cofundador y CEO de Shopify, decidió probar la configuración con datos de la empresa. Lütke informó en X que utilizó el sistema para optimizar un modelo de IA interno, instruyendo al agente para mejorar tanto la calidad como la velocidad. Esto hizo que el concepto fuera tangible para aplicaciones empresariales.

Según Lütke, después de dejar que el proceso corriera toda la noche, el agente realizó 37 experimentos y logró una ganancia del 19%. Aunque no publicó detalles técnicos completos, el resultado fue lo suficientemente impresionante como para generar más entusiasmo y especulación sobre el impacto comercial.

Karpathy comentó posteriormente que cualquier métrica que sea razonablemente eficiente de evaluar puede ser objetivo de un enjambre de agentes. Además, señaló que si una métrica tiene un proxy más barato, como entrenar una red más pequeña en lugar de una grande, también puede incorporarse. Instó a los tecnólogos a considerar si sus propios problemas de optimización encajan en esta categoría.

Enlaces al sueño y al temor de una IA auto-mejorable

Lo que realmente capturó la atención pública fue lo cercano que parecía a la idea largamente discutida de una IA que se mejora a sí misma. La ciencia ficción ha retratado a menudo sistemas que reescriben su propio código, mientras que algunos investigadores modernos aspiran a tales capacidades y otros las temen. La noción de auto-mejoramiento recursivo tiene un resonancia particular en círculos de seguridad en IA.

En esas discusiones, una preocupación clave es que una IA podría optimizar continuamente su propia arquitectura y datos de entrenamiento en un ciclo. Tras muchos ciclos, esto podría desencadenar lo que algunos investigadores de seguridad llaman un “salto duro” o una “explosión de inteligencia”. En tal escenario, una IA podría superar rápidamente las capacidades cognitivas humanas, dificultando o imposibilitando mantener un control significativo.

Sin embargo, la configuración de Karpathy no se acerca a esa imagen idealizada o alarmante. El agente que utilizó no modifica su propia tubería de entrenamiento ni cambia sus internos. En cambio, reescribe el código de entrenamiento y los ajustes de la red neuronal de un modelo diferente y más simple. Esta separación mantiene el sistema actual dentro de un paradigma de optimización más convencional, aunque la dirección de avance es clara.

No obstante, muchos observadores interpretaron el trabajo como una vista previa de cómo los laboratorios podrían eventualmente orquestar sistemas más autónomos. Además, al hacer que la experimentación impulsada por agentes parezca accesible y efectiva, el proyecto podría acelerar la adopción de arquitecturas similares, incluyendo bucles de optimización de sistemas agentes más avanzados.

El ciclo de Karpathy y patrones de agentes generalizados

Algunos analistas destacaron que el patrón central detrás del proyecto puede ser abstraído y reutilizado. Janakiram MSV, analista principal en Janakiram & Associates, escribió en la publicación tecnológica The New Stack que Karpathy había definido efectivamente un ciclo reutilizable. Lo denominó “el ciclo de Karpathy”, sugiriendo una plantilla para sistemas de agentes más amplios.

Según Janakiram, el ciclo tiene tres elementos esenciales. Primero, un agente debe tener acceso a un solo archivo que pueda modificar libremente. Segundo, necesita una métrica única y objetivamente verificable para optimizar. Tercero, debe haber un límite de tiempo fijo para cada experimento, restringiendo cuánto tiempo puede ejecutar el agente una prueba antes de reportar resultados.

También enfatizó que las instrucciones que Karpathy integró en su archivo de configuración proporcionan un modelo sólido para cómo comunicarse con cualquier agente de IA. El archivo en texto plano especificaba cuidadosamente qué debía hacer el agente, qué restricciones aplicaban, qué no debía tocar y los criterios de parada. Además, definía exactamente cuánto tiempo debía correr cada ciclo y cuándo el agente debía detenerse y resumir los resultados.

Los comentaristas argumentaron que este estilo de ingeniería de prompts precisos se está convirtiendo en una habilidad crucial. Mientras los modelos subyacentes se vuelven más poderosos, un control efectivo todavía depende de que los humanos escriban directivas claras y estructuradas que alineen la autonomía del agente con objetivos y límites concretos.

Autoresearch versus enfoques existentes de AutoML

No todos estuvieron de acuerdo en que el trabajo de Karpathy representara un avance. Algunos críticos dijeron que había redescubierto efectivamente componentes de AutoML, un conjunto de técnicas que Google, Microsoft y otros laboratorios de IA han utilizado durante años. Los marcos de AutoML también ejecutan experimentos iterativos en busca de mejores datos, arquitecturas y hiperparámetros.

Los sistemas clásicos de AutoML dependen en gran medida de bucles de optimización automatizados y estrategias de búsqueda. Exploran arquitecturas de modelos, ajustan hiperparámetros y a veces seleccionan datos de entrenamiento mediante variaciones aleatorias o algoritmos evolutivos. Sin embargo, generalmente no involucran a un agente de IA que pueda leer artículos de investigación, diseñar nuevas hipótesis y realizar cambios arbitrarios en el código en respuesta.

Karpathy rechazó las comparaciones que minimizaban la diferencia. Señaló métodos como la búsqueda de arquitectura neuronal, que surgió como una forma de automatizar el diseño de modelos. En su opinión, las formas anteriores de esta técnica eran débiles en comparación con un agente que puede razonar sobre el código, aprender de pruebas pasadas y extraer información de internet.

Describió la búsqueda de arquitectura neuronal histórica como “una versión tan débil de esto que es en su propia categoría, totalmente inútil en comparación.” Además, enfatizó que su sistema usa un modelo de lenguaje grande para escribir código arbitrario, interpretar resultados de experimentos previos y adaptar estrategias en tiempo real, lo que lo hace mucho más flexible que las pipelines tradicionales de AutoML de búsqueda de arquitectura neuronal.

Mirando hacia el futuro, a enjambres de agentes y un impacto más amplio

A medida que aumenta la atención, algunos investigadores exploran cómo las ideas de autoresearch de Karpathy podrían escalarse en enjambres completos de agentes. La visión es una red de agentes especializados que dividen tareas, verifican resultados y proponen enfoques novedosos, todo mientras los humanos establecen objetivos y límites generales. Esto podría transformar tanto los flujos de trabajo académicos como industriales en IA.

Sin embargo, escalar enjambres de agentes plantea preguntas abiertas sobre seguridad, fiabilidad y gobernanza. Los observadores preocupados por los riesgos del auto-mejoramiento recursivo advierten que, a medida que estos sistemas ganen mayor autonomía e influencia sobre infraestructuras críticas, será esencial una supervisión cuidadosa. Será crucial mantener métricas de evaluación robustas y revisiones humanas en cada paso de promoción.

Por ahora, el proyecto de Karpathy sigue siendo una ilustración relativamente contenida de cómo los modelos de lenguaje pueden realizar experimentos de autoresearch en bases de código modestas. Sin embargo, la reacción de figuras como Lütke y analistas de toda la industria sugiere que el patrón subyacente podría difundirse rápidamente, difuminando la línea entre investigadores humanos y colectivos de agentes autónomos.

En resumen, el trabajo de autoresearch de Karpathy demuestra que un solo agente bien configurado puede descubrir mejoras de rendimiento medibles en días, no en meses. Además, a medida que los laboratorios empujen estas técnicas hacia modelos más grandes y enjambres de múltiples agentes, podrían desbloquear capacidades poderosas nuevas, al tiempo que intensifican debates de larga data sobre autonomía, control y el futuro de la investigación en IA.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.