'에이닷 엑스 4.0'의 대규모 학습을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄'.
SK텔레콤은 한국어 처리에 특화한 LLM(대규모언어모델) '에이닷 엑스 4.0'을 오픈소스로 공개한다고 3일 밝혔다.
'에이닷 엑스 4.0'은 최상급의 한국어 처리 효율과 데이터 보안을 고려한 설계, 로컬 환경에서의 운영 가능성 등이 강점이다. 오픈소스 모델인 '큐웬 2.5'에 방대한 한국어 데이터를 학습시켜 국내 비즈니스 환경에 최적화했다.
자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 '에이닷 엑스 4.0'이 약 33% 높은 토큰 효율을 기록했다.
또 '에이닷 엑스 4.0'은 한국어 능력 평가 벤치마크인 KMMLU에서 78.3점을 기록해 GPT-4o(72.5점)보다 우수한 성능을 보였다. 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득해, GPT-4o(80.2점)보다 우위에 섰다.
SK텔레콤은 '에이닷 엑스 4.0'을 기업 내부 서버에 설치해 사용할 수 있는 온프레미스 방식으로 제공해 기업들이 데이터 보안 우려를 덜 수 있도록 할 계획이다.
'에이닷 엑스 4.0'은 대규모 학습(CPT) 전 과정을 외부와 연동없이 자체 데이터로 수행해 데이터의 주권도 확보했다. 표준 모델은 720억개, 경량 모델은 70억개의 매개변수를 갖추고 있어, 이용자들은 목적에 맞춰 선택해 사용할 수 있다.
SK텔레콤은 '에이닷 엑스 4.0'을 지난 5월 에이닷 통화 요약에 적용해 활용 중이다. 추후 SK그룹 내 다양한 서비스에 적용할 계획이다.
김지원 SK텔레콤 AI 모델 랩장은 "기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획"이라고 말했다.