IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

업스테이지, 中 AI 카피 의혹 일단락…남은 건 정부의 판단 [AI브리핑]

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

2000명 이상 실시간으로 지켜본 '역사적 검증회'
전문가들, 업스테이지 지지…15일 정부평가에 이목

[아이뉴스24 윤소진 기자] 연초부터 업스테이지와 사이오닉AI 간 ‘중국 모델 파생’ 공방이 업계를 뜨겁게 달궜지만, 업스테이지의 정면 돌파로 논란은 사실상 일단락된 분위기다. 문제 제기를 주도했던 사이오닉AI 측이 관련 리포트를 삭제하고 공개 검증 현장에도 모습을 드러내지 않으면서 논쟁의 무게추는 기술 진위 공방에서 제도·정책 판단의 영역으로 옮겨가고 있다.

업스테이지 솔라 오픈 현장 검증회. [사진=업스테이지]
업스테이지 솔라 오픈 현장 검증회. [사진=업스테이지]

"데이터로 증명"…업스테이지 정면 돌파

4일 업계에 따르면 업스테이지가 지난 2일 학습 로그와 체크포인트를 공개하는 검증회를 연 이후 사이오닉AI 측의 추가 문제 제기나 반박은 나오지 않고 있다. 최초 의혹의 근거로 제시됐던 분석 리포트 역시 현재는 삭제된 상태다.

이번 논란은 1일 사이오닉AI의 고석현 대표가 업스테이지가 개발한 대형 언어모델 ‘솔라 오픈 100B’가 중국 지푸(Zhipu) AI의 GLM 계열 모델에서 파생됐을 가능성이 있다고 주장하면서 시작됐다. 해당 모델이 정부가 추진 중인 ‘독자 AI 파운데이션 모델’ 프로젝트의 결과물이라는 점에서 논란은 빠르게 확산됐다.

의혹의 핵심 근거는 두 모델의 LayerNorm 파라미터 유사도였다. LayerNorm은 AI 모델 학습 과정에서 계산값이 과도하게 흔들리지 않도록 잡아주는 일종의 ‘균형 장치’로, 대부분의 대형 언어모델은 이 값을 1로 설정한 상태에서 학습을 시작한다. 이 값이 학습 과정에서도 크게 변하지 않는 경우가 많아, 서로 다른 모델 간에도 유사도가 높게 나타날 수 있다는 점이 쟁점으로 떠올랐다.

업스테이지는 의혹 제기 2시간 만에 즉각 대응에 나섰다. 김성훈 업스테이지 대표는 “솔라 오픈 100B는 외국 모델 가중치를 사용하지 않고 처음부터 학습한 모델”이라며 공개 검증회를 열겠다고 밝혔다. 실제로 다음 날 서울 강남에서 열린 검증회에서 업스테이지는 학습 로그와 중간 체크포인트를 모두 공개하며 ‘프롬 스크래치’ 개발이라는 입장을 재확인했다.

김 대표는 "처음 해당 그래프를 보고 눈을 의심할 정도로 놀랐지만, 분석의 허점을 확인하고 오히려 안도했다"면서 "통계적 착시에 불과하다"고 일축했다.

전문가들 역시 문제 제기의 분석 방식에 한계가 있다고 지적했다. 임성빈 고려대 통계학과 교수는 “LayerNorm은 초기값이 1로 설정되고 학습 과정에서도 1 근처에서 작은 변화만 일어나기 때문에, 코사인 유사도 수치가 높게 나오는 것이 구조적으로 충분히 가능하다”며 “이 수치만으로 프롬 스크래치가 아니라고 단정하는 것은 통계적으로 무리가 있다”고 설명했다.

현업 AI 엔지니어들 역시 현재 제시된 수치만으로 특정 모델이 다른 모델에서 파생됐다고 결론내리기 어렵다는 의견을 내놨다. 전 네이버·카카오 AI 엔지니어 출신 연구자와 마음AI 엔지니어 등은 “같은 모델 안에서도 특정 레이어를 어떻게 선택하느냐에 따라 유사도 값이 크게 달라질 수 있다”며 “비교 기준 자체가 왜곡될 수 있는 분석”이라고 지적했다. 이들은 도용 여부를 판단하려면 단순 유사도 수치가 아니라 학습 로그, 체크포인트, 학습 곡선 등 전체 학습 과정을 종합적으로 봐야 한다고 강조했다.

검증회 이후 사이오닉AI의 논조도 변화했다. 고석현 대표는 “보다 엄밀하게 검증하지 않은 채 공개해 불필요한 혼란을 야기한 점에 대해 사과한다”고 했다. 이후 논의를 ‘직접적 도용’이 아닌 소버린 AI 방향성과 국책 AI 사업에서 해외 코드 활용의 적절성 문제로 전환하면서 한 발 물러선 모양새다.

업스테이지 솔라 오픈 현장 검증회. [사진=업스테이지]
고석현 사이오닉AI 대표 페이스북 게시글 일부. [사진=페이스북 캡쳐]

국내 AI생태계 발전에 선례…검증 기준 나올까

업계에서는 이번 공개 검증회가 단순한 해명 자리를 넘어, 국내 AI 산업에서 전례를 남긴 사례라는 평가가 나온다. 의혹 제기 이후 기업이 학습 로그와 체크포인트를 전면 공개하고 이를 실시간으로 외부에 검증받은 사례는 사실상 처음이기 때문이다.

업계 관계자는 “기술 논쟁을, 말이 아니라 데이터로 공개 검증한 첫 사례”라며 “향후 국책 AI 사업에서 설명 책임과 검증 기준을 가늠하는 선례가 될 수 있다”고 말했다.

다만 이번 사안이 명확한 결론에 도달한 것은 아니다. 정부 차원의 공식 판단이나 평가 결과는 아직 나오지 않았기 때문이다. 업계에서는 이번 논란의 본질을 특정 기업의 ‘도용 여부’보다는, 국책 AI 사업에서 요구하는 ‘프롬 스크래치’ 기준과 검증 방식의 불명확성에서 찾는 시각이 많다.

실제로 이번 공방을 계기로 △가중치를 처음부터 학습하면 독자 모델로 볼 수 있는지 △해외 오픈소스 코드 활용의 허용 범위는 어디까지인지 △기업이 어느 수준까지 학습 과정을 공개해야 하는지 등 정책적 쟁점이 동시에 부각됐다.

현재로서는 이번 논란이 업스테이지가 참여 중인 정부 독자AI파운데이션 모델 프로젝트 평가에 어떤 영향을 미칠지도 불투명하다. 이 프로젝트는 프롬 스크래치 모델 개발 여부를 핵심 기준으로 삼고 있다. 과학기술정보통신부는 5개 정예팀 중 1개 탈락팀이 발생하는 1차 평가를 1월 중순 결과 발표를 목표로 진행 중이다.

/윤소진 기자(sojin@inews24.com)



주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 업스테이지, 中 AI 카피 의혹 일단락…남은 건 정부의 판단 [AI브리핑]

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.



TIMELINE



포토 F/O/C/U/S