22일 개막하는 KBO리그 정규시즌을 앞두고 각종 예측이 쏟아졌다. 지난 20일 열린 미디어데이 행사에서 소속팀이 있는 감독·코치·선수들은 낙관적인 전망을 내놓았다. 팬들에게 희망을 주기 위해서일 것이다. 언사가 자유로운 해설위원들은 가급적 객관적으로 답하려 한다. 야구 관계자들과 팬들이 시즌 후 해설위원의 정확성을 검증하기 때문이다.
입장이 서로 다르지만, 이 예측의 공통점은 ‘사람’이 했다는 점이다. 그래서 감정이 들어간다. 허세를 부리는 선수도, 엄살을 떠는 감독도 있다. 해설위원도 친소 관계에 따라 본심과 달리 대답할 수 있다.
20일 서울 잠실 롯데호텔월드에서 열린 KBO 미디어데이&팬페스트. 10개 구단 감독들은 하나같이 우승 또는 포스트시즌 진출을 다짐했다. 잠실=정시종 기자
인공지능(AI)이라면 어떨까. 감정 없이 데이터를 기반으로 예측할 수 있지 않을까. 최근 실생활에서 여러 임무를 수행하는 AI가 야구인과 다른 대답을 내놓지 않을까.
퍼플렉시티·제미나이 선택은 KIA
시범경기가 끝난 뒤 AI에 몇 가지를 질문했다. 2025년 정규시즌 개막에 앞서 충분한 데이터가 쌓였을 것이다. 해설위원들과 다르게 예측하기를 기대했다.
그러나 AI의 전망은 전문가의 예측과 대동소이했다. 질문을 받은 3개 AI 중 퍼플렉시티(Perplexity)와 제미나이(Gemini) 모두 KIA 타이거즈를 가장 유력한 우승 후보로 꼽았다.
퍼플렉시티는 “KIA는 강력한 타선과 균형 잡힌 투수진으로 우승 후보 1순위로 꼽힌다. 외국인 타자 패트릭 위즈덤의 활약이 기대된다”며 “KIA는 역사상 가장 많은 12회 우승을 했고, 한국시리즈에서 한 번도 패하지 않았다”라고 설명했다. 퍼플렉시티는 KIA의 한국시리즈 상대를 삼성으로 예상했다. 그러나 정규시즌 2위로는 LG 트윈스를 꼽았다.
퍼플렉시티는 “르윈 디아즈를 4번 타자로 활용하고, 데니 레예스와 아리엘 후라도의 원투 펀치로 구성하는 삼성이 상위권을 유지할 것”이라며 “LG는 문보경이 중심인 타선과 (외국인 투수) 요니 치리노스, 엘리에이저 에르난데스의 활약이 기대된다”고 했다.
퍼플렉시티의 답을 보면, 외국인 선수 영입을 큰 비중으로 판단하고 있다는 걸 추측할 수 있다. 2024년 전력을 기반으로 외국인 선수와 자유계약선수(FA) 계약을 기반으로 올해 성적을 가늠했다.
제미나이의 답도 크게 다르지 않았다. KIA를 우승 후보로 꼽은 데 이어 삼성을 상위권으로 예측했다. 색다른 시각은 한화 이글스를 3강 중 하나로 꼽으며 “젊은 선수들의 성장과 베테랑의 조화로 다크호스로 평가받고 있다”고 설명한 점이다.
챗GPT “예측 정확성 55~65%”
AI 중 가장 대중적으로 활용되는 챗GPT가 일반적인 예상으로부터 가장 먼 대답을 내놨다. 챗GPT는 두산 베어스와 KT 위즈를 1·2위로 꼽았다. 그러나 한국시리즈에서 만날 두 팀을 선정해 달라는 질문에는 “LG와 KT”라며 “두산, KIA, NC 다이노스 같은 팀도 충분히 경쟁력을 가질 수 있다”고 답했다.
일반적인 예측과 다소 다른 대답을 내놓은 챗GPT의 예측 근거가 궁금했다. 퍼플렉시티는 예측에 활용하는 자료(뉴스, 기록, 통계 사이트)를 공개하는 반면, 챗GPT는 근거를 밝히지 않는다. 다만 챗GPT는 “2024시즌 성적 및 팀 전력, FA 및 외국인 선수 영입 상황, 유망주 성장 가능성, 부상 변수 및 팀 뎁스(선수층)를 참고했다”고 했다. 챗GPT는 KIA를 5위로 예측했다. 8위를 SK 와이번스(SSG 랜더스의 전신)라고 한 것은 서칭 능력에 대한 의문을 남겼다.
챗GPT는 “단순 승패 예측은 약 55~65% 정도의 정확성을 가진다. 야구에는 변수가 많기에 세부적인 점수 예측 정확도는 낮다. 트렌드를 파악하는 데 도움을 줄 수 있지만, 실시간 변수까지 반영하는 것은 어렵기 때문에 참고 자료로만 활용하는 것이 좋다”라고 부연했다.
퍼플렉시티는 “AI 모델을 사용한 한국 프로야구 승패 예측 연구에서 딥러닝(deep learning) 모델이 89%의 정확도를 기록했다. 이는 퍼플렉시티와 같은 고급 AI 모델이 KBO리그 경기 예측에도 유사한 수준의 정확도를 달성할 수 있음을 시사한다”고 밝혔다.
승패보다 선수 가치 측정에 적합
AI를 통한 스포츠 경기 예측은 머신 러닝(machine learning) 기술을 활용한다. 데이터를 기반으로 패턴을 학습하는 머신 러닝도 승패 예측 정확성은 높지 않다고 한다. 순위 등을 내다보기보다 각 선수의 가치와 기여도 등을 측정하는 데 유용하다. 챗GPT 등이 승패 예측에 있어서 아직은 ‘참고용’인 이유다.
AI가 야구의 승패를 예측하기 어려운 이유는 ‘데이터가 많지만, 변수도 많기 때문’이라고 한다. 게다가 투구 궤적, 회전수, 타구 속도, 발사각 등 현장에서 활용하는 트래킹 데이터가 대중에게 충분히 공개되지 않는다는 한계도 있다.
따라서 현재 AI가 활용하는 자료는 대부분 직전 시즌의 기록과 인간(선수, 코칭스태프, 해설위원, 기자 등)의 전망으로부터 나온다. 해설위원 전망과 AI의 예측이 비슷한 이유다.
알파고가 바둑에서 이창호 9단을 이긴 게 2016년이었다. 주식에서도 알고리즘 매매의 비중이 갈수록 커지고 있다. 스포츠 예측 분야에서도 AI가 인간을 대체할 날이 언제 올지 모른다.
정확성을 크게 기대하지 않더라도 AI에게 묻고 싶은 게 또 있다. 2023년 KBO리그 정규시즌 최우수선수(MVP)는 누구일까.
퍼플렉시티는 김도영(KIA)이 될 거라 답했고, 챗GPT는 특정한 선수를 꼽지 않았다. 제미나이는 김도영·류현진(한화)·최정(SSG 랜더스) 등 3명을 차례로 꼽았다. AI가 2024년 기록과 누적 통계를 근거로 예측했다고 볼 수 있다. 이 역시 사람과 크게 다르진 않았다.