관련 뉴스35건8개 미디어
정치
진보 성향

중국AI가 미국AI를 따라잡는 시간은?

오마이뉴스
조회 0
중국AI가 미국AI를 따라잡는 시간은?

AI 통합 요약

도널드 트럼프 미국 대통령이 AI 개발사 앤트로픽을 국가 안보 위협으로 더 이상 보지 않는다고 밝혔다. 미토스5와 페이블5 모델의 수출을 국가 안보를 이유로 제한한 지 불과 며칠 만에 이같이 입장을 바꾼 것으로, G7 정상회담에서 앤트로픽 CEO 다리오 아모데이와 직면한 후의 변화로 전해진다. 미국 정부의 AI 정책이 국제 외교와 산업 현실 사이에서 빠르게 전환되고 있음을 보여주는 사건이다.

이 이슈, 어느 시각에 더 공감하세요?

공감하는 시각을 고르면 독자 분위기가 보여요 · 로그인 불필요

미국 행정부가 엔트로픽(Anthropic)의 최강 AI 모델 미토스(Mythos)와 그 일반 버전 페이블(Fable)을 외국인에게 차단한 날 중국AI업계는 오픈소스 모델과 오픈소스 사후 학습 진영에 환호했습니다.

6월 17일 즈푸가 GLM-5.2를 공개하며 전 세계 오픈소스 모델 중 최고 성능을 기록했고 포스트 트레이닝 전문 스타트업 '마인드 랩(Mind Lab)'이 재빠르게 GLM-5.2 후학습으로 성능을 끌어올려 오픈소스 진영의 협공을 선보였습니다.

중국AI가 미국을 따라잡는 시간은

AI 독립 연구원 Teortaxes는 GLM-5.2의 현재 능력을 Claude Opus 4.7에서 4.8 사이로 평가했습니다. Mythos와 GLM을 7개월의 격차로 추정했습니다. 일론 머스크(Elon Musk)는 "아마도 2027년 1분기"라는 더 보수적인 의견을 보였습니다. 그는 벤치마크 추격은 상대적으로 쉬운 일이지만, "진정한 유용성(real usefulness)"으로 측정하면 2027년 1분기라도 인상적인 수준이라고 덧붙였습니다.

그러나 이 논쟁의 당사자인 즈푸AI 창립자 탕제(唐杰)는 단 네 단어로 답했습니다. "그렇게 오래 걸리지 않는다(won't take that long)". 그는 구체적인 시점을 제시하지 않았습니다. 그러나 그 한마디에는 중국 AI가 쌓아온 추격의 궤적에 대한 확신이 담겨 있었습니다.

GLM-5.2가 보여준 것

탕제의 자신감은 허언이 아니었습니다. GLM-5.2는 MoE(혼합 전문가) 아키텍처에 총 744B 파라미터, 활성화 파라미터 약 40B, 1M 토큰의 장문맥 처리 능력을 갖췄습니다.

수치로 기록된 성과도 인상적입니다. Artificial Analysis 종합 지수에서 51점으로 글로벌 오픈소스 모델 1위를 기록했으며, FrontierSWE 롱코딩 벤치마크에서는 74.4점을 획득해 Claude Opus 4.8(75.1점)과의 격차를 1%포인트로 좁혔습니다. Code Arena에서는 글로벌 모든 모델 중 1위를 차지했습니다.

더욱 주목할 점은 비용입니다. 동일한 작업에서 GLM-5.2의 비용은 0.06달러인 반면, Opus 4.8은 0.49달러로 무려 8배 이상의 차이를 보입니다. "10%의 지능 차이가 90%의 비용 차이"로 이어지는 이 구조는 대형 모델 경쟁의 중심을 성능에서 실용성과 경제성으로 이동시키고 있습니다.

파운데이션 모델만으로는 부족하다

그러나 GLM-5.2의 성과만으로 Mythos를 따라잡았다고 말하기는 어렵습니다. SWE-Marathon과 같은 가장 도전적인 벤치마크에서는 여전히 13.0 대 26.0으로 상당한 격차가 존재합니다.

더 근본적인 질문은 이것입니다: "Mythos를 따라잡는 것이 파운데이션 모델 강화로 충분한가?"

OpenAI가 GPT-4에서 o1로 도약할 때 핵심 경쟁력은 사후학습 (post-training)에서 비롯되었습니다. Anthropic의 Constitutional AI 역시 포스트 트레이닝 방법론입니다. Foundation Model은 건물의 설계도와 같아서 최대 높이를 결정합니다.

그러나 실제로 그 높이까지 건물을 완성하는 것은 Post-training이라는 시공 기술에 달려 있습니다. GLM-5.1에서 5.2로의 도약은 설계도는 동일했지만 시공 기술의 혁신이 더 높은 완성도를 가능하게 했음을 보여주는 사례입니다. 이는 파운데이션 모델의 경쟁이 점차 상향 평준화 되면서 Post-training의 품질이 제품의 실제 체감 성능을 결정하는 분수령이 되고 있음을 시사합니다.

전체 내용보기 ...

전문 보기

이 뉴스, 독자들은 어떻게 느꼈나요?

첫 반응을 남겨보세요

로그인하면 감정 반응에 참여할 수 있어요.

관련 뉴스 제보는 로그인 후 가능합니다.