[아이뉴스24 정종오 기자] 눈보라에도 차선을 이탈하지 않는 자율주행차, 저화질 사진으로도 암을 진단하는 의료 인공지능(AI) 등을 만들기 위해서 AI 모델의 ‘강건성’이 뛰어나야 한다.
데이터 증강은 이러한 강건성을 높이는 기법으로 널리 쓰여왔다. 그 정확한 강건성 향상 조건을 국내 연구팀이 수학적으로 증명했다. 수학적 검증만으로도 효과적 증강 기법을 선별할 수 있게 돼 AI 모델 개발의 생산성을 크게 높일 수 있을 전망이다.
울산과학기술원(UNIST) 인공지능대학원 윤성환 교수팀은 AI 학습의 필수 단계인 데이터 증강이 모델의 강건성을 높이는 조건을 수학적으로 증명했다고 19일 발표했다.
![PSA 증강이 평탄한 최소점을 형성하는 과정. [사진=UNIST]](https://image.inews24.com/v1/f886769383c793.jpg)
딥러닝 모델은 학습한 데이터와 조금만 다른 환경에 노출되면 성능이 급격히 떨어지는 약점이 있다. 원본 데이터에 인위적으로 변형을 가해 학습량을 늘리는 데이터 증강이 필수적 이유다. 어떤 변형 방식이 가장 효과적인지에 대해서는 명확히 밝혀진 바가 없다. 수많은 시행착오를 반복해야만 했다.
이번 연구를 보면 근접 지지 증강(PSA, Proximal-Support Augmentation)이라는 조건을 만족하는 증강일수록 원하는 효과를 거둘 수 있다. PSA는 원본 데이터에 미세한 변형을 가해 원본 데이터 주변을 촘촘히 채우는 증강 방식이다.
연구팀은 먼저 데이터 공간과 파라미터 공간에서 변화가 서로 대응된다는 점을 증명했다. PSA 조건을 만족하는 데이터 공간에서의 변화가 파라미터 공간의 손실함수 지형도 평평하게 다져준다는 사실을 입증했다.
입력 데이터 주변을 촘촘히 채우면, 이에 대응하는 모델 내부의 파라미터 공간도 평평해져 AI가 강건성을 갖추게 되는 것이다. 모델 손실함수의 지형이 평탄(Flat Minima)할 경우 뾰족한 지형(Sharp Minima)에 비해 강건성이 높다.
실제 실험에서도 PSA 조건을 충족한 데이터 증강 기법이 그렇지 않은 기법보다 월등한 강건성을 보였다.
연구팀은 “데이터 증강 설계를 보다 체계적 과학으로 만든 연구”라며 “자율주행, 의료 영상, 제조 검사처럼 분포가 자주 바뀌는 실제 환경에서 신뢰할 수 있는 AI 모델을 만드는 데 중요한 이론적 기반이 될 것”이라고 설명했다.
이번 연구(논문명: A Flat Minima Perspective on Understanding Augmentations and Model Robustness)는 세계적 인공지능 학술대회 중 하나인 전미인공지능학회(AAAI, Association for the Advancement of Artificial Intelligence) 2026 정식 논문으로 채택됐다. 올해 학회는 오는 20일부터 27일까지 싱가포르에서 열린다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기