2026년 3월에 인스타 스토리에 쓴 글을 옮겨왔습니다.

안드레 카파시(Andrej Karpathy)가 최근 공개한 autoresearch 프로젝트는 AI 모델 개발 프로세스가 인간의 직접적인 개입에서 벗어나 자율적 진화의 단계로 진입했음을 보여주는 실증적 사례다. 이 실험의 핵심 메커니즘은 단순하면서도 파격적이다. 인간은 에이전트의 지침을 수정해 연구의 방향성과 환경을 정의하고, AI 에이전트는 이를 바탕으로 실제 학습 코드인 train.py를 무한히 수정하며 최적의 해를 찾아낸다.

이 시스템의 가장 큰 특징은 5분이라는 고정된 시간 예산 내에서 작동한다는 점이다. 시스템은 주어진 시간 내에 현재의 하드웨어에서 도출할 수 있는 최상의 모델 아키텍처와 하이퍼파라미터를 스스로 탐색한다. 인간 연구자가 수동으로 가설을 세우고 실험하던 과거의 방식과 달리, 에이전트는 하룻밤 사이에도 100회 이상의 독립적인 실험을 수행하며 검증 지표를 개선한다.

과거 막대한 자원이 소모되던 GPT-2급 모델 학습이 단 2시간 내외의 대화형 주기로 편입된 것은, 모델 개발이 더 이상 정적인 제조 공정이 아니라 실시간으로 적응하고 최적화되는 유기적 프로세스로 변모했음을 의미한다.

이러한 변화는 개발자의 정체성을 근본적으로 재정의한다. 개발자의 역량은 이제 개별 기능을 구현하는 코딩 능력이 아니라, 에이전트가 효율적으로 진화할 수 있는 메타 셋업을 구축하는 능력으로 이동한다. 이는 소프트웨어를 고정된 도구가 아닌, 특정 목적 함수를 달성하기 위해 스스로 변형되는 유기체로 취급하기 시작했음을 시사한다. 리드미에서 언급된 것처럼, 인간은 이제 Python 파일을 직접 수정하는 대신 에이전트의 지능적 행동을 유도하는 전략 언어를 프로그래밍하게 된다.

시스템이 스스로를 개선하는 속도가 인간의 인지 속도를 추월하기 시작하면, 소프트웨어는 점차 인간의 논리적 이해를 벗어난 자기 수정형 바이너리 혹은 블랙박스 형태의 최적화 집합으로 진화할 것이다. 이러한 환경에서 인간의 역할은 ‘무엇을 만들 것인가’라는 질문을 수행하는 주체에서, 시스템이 산출한 결과물의 가치를 사후적으로 검증하고 승인하는 최종 평가자로 수렴될 가능성이 크다.

결국 카파시의 실험은 기술이 단순히 인간의 노동을 보조하는 단계를 넘어, 스스로 발전의 경로를 결정하는 자율적 연구 기관으로 변모하는 시대의 초입에 들어섰음을 알리는 결정적 신호탄이라 할 수 있다. 기대와 동시에 두려움이 느껴진다.