KT 기술혁신부문 연구원들이 서울 서초구 KT 우면연구센터에서 '믿:음 2.0'을 테스트하고 있다. KT 제공 그간 글로벌 빅테크 파트너십에 집중했던 KT가 자체 LLM(대규모언어모델) 고도화에도 힘을 쏟는다. 정부의 소버린(국가 주권) AI 프로젝트를 겨냥해 한국인의 정서를 반영하는 것은 물론, 국민이 신뢰하고 쓸 수 있는 데이터 주권에 방점을 찍었다.
KT는 3일 온라인 간담회에서 ‘한국적 AI’를 표방한 LLM ‘믿:음 2.0’을 공개했다. AI 개발자 플랫폼 허깅페이스에 개인과 기업, 공공 누구나 상업적으로 활용할 수 있도록 푼다.
이에 ‘믿:음’은 첫 모델 출시 이후 2년 만에 새로운 모습으로 등장했다. 지금까지 KT는 자체 모델을 전면에 내세우는 대신, 전 세계에서 가장 널리 쓰이는 챗GPT의 한국 버전을 만드는 전략을 취해왔다.
회사가 지난해 챗GPT의 투자자인 마이크로소프트와 전략적 파트너십을 맺고 2조4000억원의 대규모 투자를 결정한 이유다. 김영섭 KT 대표는 “AI 기술과 규모의 고도화는 게임이 이미 끝난 것으로 보고 있다”며 “그러면 협업을 해야 하고 수준과 속도를 높이는 게 차별화”라고 언급한 바 있다.
그랬던 KT가 소버린 AI에 다시 눈을 돌린 것은 이재명 정부가 구상하는 ‘AI 투자 100조 시대’에 대응하기 위해서라는 해석도 나온다.
신동훈 KT Gen AI 랩장은 “한 번도 자체 기술을 포기한다고 생각한 적 없다”며 “대한민국 통신 산업을 책임지는 기간통신사업자가 생성형 AI 원천 기술을 확보해야 한다는 믿음으로 작업하고 있다”고 강조했다.
KT가 이번에 선보이는 모델은 15억 파라미터 규모의 ‘믿:음 2.0 베이스’와 23억 파라미터 규모의 ‘믿:음 2.0 미니’ 2종이다. 베이스는 한국 특화 지식과 문서 기반의 질의응답에 강하다. 미니는 베이스 모델의 지식을 학습한 소형 모델이다.
KT는 ‘믿:음 2.0’이 챗GPT 수준의 성능에 도달하지는 못했지만, 한국과 관련한 작업에서 경쟁 모델 대비 우위에 있다고 자신했다.
고려대학교와 공동 개발한 한국어 AI 역량 평가 지표인 ‘코-소버린’ 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다. 언어, 문화, 사회, 역사 등 한국적 맥락을 정밀하게 반영한 전문가 수준의 문항을 이해했다.
또 한국인의 정서를 파악하는 예시로 MBTI 테스트를 제시했다. ‘믿:음 2.0’은 “나 오늘 우울해서 빵을 샀어”라는 말을 들었을 때 빵의 종류 묻기보다 감정 변화에 주목해야 원활한 관계를 유지할 수 있다고 설명했다.
KT는 이처럼 한국적인 AI를 설계하는 과정에서 데이터 주권, AI 모델 선택권, 한국적 가치관·문화, 안전·신뢰 등 4대 철학을 반영했다.
특히 데이터 주권을 차별화 강점으로 꼽았다. KT는 1년여간 데이터 얼라이언스와 손잡고 한국인의 가치와 문화, 역사 데이터를 학습하는 작업을 진행했다. 상업적으로 이용이 불가하거나 판단이 모호한 회색 영역은 배제해 저작권 이슈를 해결했다. 데이터 얼라이언스 참여사와 규모 등은 이달 중 공개할 예정이다.
오승필 KT CTO(최고기술책임자)는 “어떤 AI 모델도 우리 데이터의 주권을 지킬 수 있어야 한다”며 “국민이 쓰는 데이터의 유출을 차단하고, 온전히 관리할 수 있는 데이터 주권에 중점을 두고 있다”고 말했다.