preLoad Image preLoad Image
검색 바로가기
주메뉴 바로가기
주요 기사 바로가기
다른 기사, 광고영역 바로가기
중앙일보 사이트맵 바로가기
닫기
닫기

[뉴스 클립] 뉴스 인 뉴스 <246> 축구와 빅데이터

김원 기자
2014 브라질 월드컵이 막바지로 치닫고 있습니다. 이영표(37) KBS 해설위원의 경기 결과 예상이 눈길을 끌었습니다. 하지만 빅데이터를 분석을 통해 8강 진출팀을 정확히 예측한 구글과 비교하면 이영표 해설위원의 예측은 그리 대단해 보이지 않습니다. 이렇게 빅데이터를 활용한 분석이 이번 월드컵을 통해 주목을 받고 있습니다. 빅데이터와 축구가 만난 사례를 소개합니다.



1경기 당 슈팅·패스 정보 4000개 축적 … 과학축구 가능해져
독일, IT기업과 손잡고 선수 몸에 센서 부착
훈련당 10만 개 정보 일목요연하게 정리
FIFA 트래킹 시스템 미사일 추적기술 응용
카메라 16대 영상 찍어 심리상태 분석도 가능

◆빅데이터 분석 ‘SAP’와 만난 독일 축구



 독일축구협회(DFB)는 브라질 월드컵을 앞두고 IT기업 SAP와 손을 잡았다. 독일에 본사를 둔 SAP는 빅데이터 분석 기술이 좋다. 독일 대표팀의 월드컵 우승을 위해 축구와 빅데이터가 만난 것이다.



 독일 선수들은 훈련 시 몸에 센서를 부착한다. 여기까지는 특별할 게 없다. 축구에서 센서를 통해 선수의 호흡수·맥박·활동량 등을 분석하는 기술은 널리 사용되고 있다. 독일 선수 한 명의 센서에서 생성되는 데이터는 분당 1만2000여 건으로 보통 한 번의 훈련에서 10만 건 이상의 데이터가 수집된다. 여기서부터 SAP의 기술이 활용된다. 수집된 데이터는 빅데이터 분석 플랫폼인 ‘SAP HANA’를 통해 유의미한 정보로 탈바꿈한다. 그리고 항목이 일목요연하게 정리된 매치 인사이트(Match Insight) 프로그램을 통해 코칭스태프과 선수들이 원하는 정보를 실시간으로 확인할 수 있게 된다.



 지난해 11월 열린 독일과 이탈리아의 평가전에서 이 기술이 처음 활용됐다. 당시 경기장에 설치된 네 대의 카메라에서 10초마다 트래킹(Tracking·위치 추적) 정보를 수집했다. 이 데이터를 실시간으로 분석한 뒤 전반전이 끝나고 선수들에게 곧바로 피드백을 줬다. 이 경기에서 독일은 1-1로 비기며 이탈리아전 18년 연속 무승 징크스를 깨지 못했지만, 경기 내내 상대를 압도하며 월등한 경기력을 선보였다.



1 훈련 전 발목에 센서를 부착한다 2 훈련 도중 센서를 통해 선수의 호흡수·맥박·활동량 등이 수집된다. 3 수집된 데이터는 훈련장에 설치된 무선 수신기에 전송된다. 4 수신된 빅데이터는 분석 플랫폼인 ‘SAP HANA’에서 분석 과정을 거친다. 5 분석된 데이터는 매치 인사이트 프로그램을 통해 확인할 수 있다. 필요한 정보가 일목요연하게 정리돼 있다. [사진=SAP]


 ◆트래킹 시스템이 만든 빅데이터



 국제축구연맹(FIFA)은 이번 월드컵에서 트라캅(TRACAB), 델타트레(Deltatre), 옵타(Opta) 등과 손을 잡고 실시간 트래킹 시스템과 데이터 분석 기술을 활용하고 있다. 트래킹 시스템에는 초정밀 광학 기술이 사용된다. 특히 트라캅에는 스웨덴 전투기 야스 그리펜(Jas Gripen)의 미사일 추적 기술이 그대로 적용됐다.



 트래킹 시스템은 경기장에 설치된 카메라 16대를 통해 만들어진 영상 데이터가 핵심이다. 이 데이터는 컨트롤 센터의 컴퓨터로 전송되고, 분석 프로그램에서 가공된 정보는 방송 중계 화면과 인터넷을 통해 실시간으로 확인할 수 있다. 선수의 움직임이나 선수 간의 간격, 공의 방향, 선수가 뛴 거리, 순간 속도 등이다.



 보통 트래킹 시스템을 활용하면 1초에 30프레임(장면) 이상의 데이터를 추출할 수 있다. 한 경기 90분 동안 산술적으로 선수당 16만2000여 개의 영상 데이터가 쌓인다. 이를 분석해 슈팅·파울·패스 등 기록 가능한 데이터로 환산하면 2000~4000개의 정보가 만들어진다. 한 경기 만에 선수와 팀에 대한 빅데이터가 구축되는 셈이다. 트래킹 시스템이 기초 데이터 수집(Raw Data Mining) 과정이라면 빅데이터 가공에는 부호화 분석 방법이 적용된다. 부호화 분석은 컴퓨터나 손으로 수행되는 분석이 가능하도록 특정한 자료에 숫자부호를 할당하는 것을 말한다. 선수의 플레이가 숫자 부호로 변환되면 아무리 방대한 데이터라 하더라도 분석이 용이해진다.



 빅데이터 분석을 통해 얻을 수 있는 정보는 상상 이상이다. 한 경기의 분석에 그치지 않고 수년 전 자료까지 활용할 수 있기 때문이다. 누적된 데이터를 통해 상대팀의 약점을 자세히 알 수 있고, 이에 맞는 전술을 수립할 수 있다. 그동안 이 과정이 감독의 ‘경험’이나 ‘감’에 의존했다면, 지금은 데이터가 그 기준이 되는 것이다.



 ◆빅데이터와 친한 야구



지난 1월 ‘CES 2014’에서 SAP 관계자가 축구 빅데이터가 어떻게 가공되고 활용되는지를 설명하고 있다. 월드컵 결승에 진출한 독일 축구 대표팀의 ‘SAP HANA’ 활용. [사진=SAP]
 사실 스포츠에서 빅데이터 분석은 널리 사용되고 있다. 미식축구·테니스·F1 자동차경주 등이 대표적이다. 기록의 스포츠라는 야구에서는 세이버매트릭스(Sabermatrics)라는 빅데이터 통계 분석법이 발달했다. 야구는 축구와는 달리 플레이 하나하나가 확실히 구분되는 경기다. 이 때문에 기록 수집이 수월하다. 실제 현장에서도 이 데이터의 가치를 인정하는 추세다.



 최근에는 트래킹 시스템도 도입됐다. 지난 2007년 ‘스포트비전’이 개발한 ‘Pitch F/X’는 홈플레이트 뒤쪽·내야·외야 관중석에 카메라를 설치한 후 공의 궤적을 쫓아 스피드를 잰다. 투수가 공을 던져 포수 미트에 도달하는 순간까지 약 0.4초 동안 50번 이상 스피드를 측정할 수 있다. 축구에서 활용하는 트래킹 시스템과 같은 원리다. 기존의 스피드건은 어느 한 시점의 구속을 측정하는 1차원 기술이라면 Pitch F/X는 카메라 세 대를 활용한 3차원 측정 방식인 셈이다.



 이 시스템은 스피드 측정 이외에도 투구 궤적, 투수가 공을 놓는 점 등을 파악해 구체적인 분석이 가능해졌다. 우리나라에서도 ‘스포츠투아이’가 이와 비슷한 시스템을 구축해 활용하고 있다. 프로야구 중계방송에 나오는 스트라이크 존, 투구 궤적 등이 이 시스템을 활용한 것이다. 메이저리그에서는 최근 타구 비행 속도, 각도, 비거리, 야수와 거리, 야수의 반응 속도 등을 측정할 수 있는 시스템을 구축하고 있다.



 ◆빅데이터로 제 2의 수아레스 막는다



 지금까지 국내에서 축구 전력 분석은 경기를 촬영한 장면을 돌려보며 상대팀의 전술과 선수의 특징을 파악하는 방법이었다. 단편적인 분석에 그칠 수밖에 없었다. 하지만 최근에는 외국 유명 구단의 전력 분석 방법이 국내에도 알려지면서 점차 빅데이터를 활용한 데이터 분석이 조명을 받고 있다. 트래킹 시스템과 부호화 분석 기술을 모두 보유한 ‘비주얼 스포츠’가 선두 격이다. 비주얼 스포츠는 2010~2011년 조광래 감독 시절 국가대표팀의 전력 분석을 맡았고, 현재는 U-19 국가대표팀과 K리그 인천·수원·성남·울산 등의 전력 분석에 도움을 주고 있다.



 물론 빅데이터 분석이 승리를 담보하지는 않는다. 감독의 의도에 따라 전술이 만들어지고, 이를 경기에서 활용하는 것은 선수의 몫이다. 하지만 감독의 의사 결정 및 선수의 능력 향상에 도움을 주고 있다는 점만은 분명하다.



 표상일 비주얼 스포츠 팀장은 “과거에는 경기 후 선수에게 제공하는 피드백이 제한적이었다. ‘잘 뛰었다’ 정도의 수준이었다. 하지만 구체적인 데이터가 제공되면서부터 선수에게 목표 의식이 생겼다”고 말했다. 이미 유럽에서는 빅데이터 분석이 구단 운영에까지 영향을 미치고 있다. 전술 수립, 선수 선발, 훈련법 개발 등은 물론이고, 마케팅에도 활용되고 있다.



 전문가들은 빅데이터 분석이 선수의 심리 상태까지 파악해 경기력에 도움이 되는 단계로 발전할 것으로 예상하고 있다. 예를 들어 슈팅 시 선수의 표정을 분석해 심리 상태가 슈팅에 미치는 영향을 파악해 낼 수 있다. 또 빅데이터를 통해 선수가 어떤 상황에서 흥분하는지를 분석해 경기 전 선수의 돌발 행동을 미연에 방지할 수도 있게 된다. 경기 도중 볼을 빼앗은 선수를 팔꿈치로 가격한 알렉상드르 송(27·카메룬)이나 상대 선수를 이빨로 문 루이스 수아레스(27·우루과이)와 같은 행동을 막을 수 있는 것이다.



 ◆빅데이터도 나무에서 떨어진다?



 축구와 빅데이터의 만남은 아직 완벽한 결과를 보여주진 않는다. 특히 이번 월드컵에서 많은 문제점이 드러나고 있다. 국제축구연맹(FIFA)은 월드컵 기간 매 경기 종료 후 경기 보고서를 공식 홈페이지를 통해 제공하고 있다. 경기 보고서에는 골·어시스트·파울 등 기본적인 정보 이외에도 유효슈팅, 패스 성공률, 활동량, 공격 방향 등 가공 데이터도 함께 보여준다. 이런 정보는 FIFA만 취합하는 것은 아니다. 하지만 발표 기관마다 정보의 내용이 천차만별이다.



 실례로 FIFA 공식 홈페이지에는 지난달 18일 러시아전 우리 대표팀 미드필더 기성용의 패스 성공률을 84%(80회 시도/67회 성공)로 발표했다. 다른 자료에는 95%다. ‘비주얼 스포츠’가 자체 조사한 자료에도 기성용의 패스 성공률은 95.5%다. 같은 날 열린 알제리와 벨기에의 경기 보고서에서도 오류를 찾을 수 있다. 알제리의 공격 방향이 좌 29%-우 71%로 나와 있다. 자료만 놓고 보면 중앙 공격이 전혀 이뤄지지 않았다. 실제 경기에서 알제리는 측면 공격에 비해 중앙 공격이 적었지만, 0%는 상식 밖의 수치다.



 표상일 팀장은 “용어의 정의가 모호하다. 유효슈팅은 보통 골문 안으로 향하는 슈팅을 의미한다. 하지만 이번 월드컵에서 FIFA는 골문보다 넓은 공간을 유효 슈팅 범위로 잡고 있다”고 했다. 용어의 정의가 국가나 리그마다 다른 것도 이유다. 어시스트(도움)를 측정하는 방식이 독일 분데스리가와 잉글랜드 프리미어리그가 서로 다르다. 이를 보완하기 위해선 통일된 기준이 필요하다.



 기록을 측정하기 애매한 상황도 있다. 예를 들어 측면에서 올린 크로스가 빗맞아 골키퍼 정면으로 가는 경우 이를 크로스로 봐야 할지 슈팅으로 기록해야 할지 모호하다. 어떤 의도를 갖고 선수가 플레이를 했는지가 판단 기준이 되지만, 이마저도 어려운 경우가 발생한다. 이럴 경우 보통 데이터를 입력하는 분석관의 자의적인 판단이 들어간다. 이 분야에 전문 교육을 받은 분석관이 필요한 이유다.



 특히 이번 월드컵에선 보정 데이터를 제공하지 않고 있다. 실시간으로 데이터가 나오다 보니 오차가 나오게 마련이다. 표상일 팀장은 “유럽 리그에서는 보통 실시간 데이터를 제공하고, 4~5시간 이후에 오류를 수정한 보정 데이터를 제공하지만, 이번 월드컵에선 그런 과정이 없는 것 같다”고 했다. 무엇보다 FIFA가 기록에 대한 가치를 인정하고, 소중히 여겨야 하지만 그 역할을 제대로 하지 못하고 있다는 평가가 나온다.



김원 기자
AD
온라인 구독신청 지면 구독신청

PHOTO & VIDEO

shpping&life

댓글 많은 기사