캐글은 AI 데이터를 분석하고 예측 모델을 만드는 플랫폼이다. 기업 및 각종 단체에서 데이터와 해결 과제를 제시하면 데이터 과학자들이 해결 모델을 개발하고 경쟁한다. 호주의 스타트업(신생 벤처기업)이 2010년부터 운영하던 것을 구글이 그 가능성을 보고 2017년 3월 인수했다. 인수 당시 이미 60만 명의 데이터 과학자가 활동하고 있었다. 웬만한 AI 전문가들에게 캐글은 가장 큰 놀이터인 셈이다.
이 사이트에 가입한 회원(캐글러)만 300만 명에 이른다. 현재 16개 과제가 진행 중이며 끝난 과제는 352개나 된다. 이 가운데엔 중국 바이두에서 요청한 자율주행 관련 경쟁도 있고 위키피디아에 내용이 맞는지 검색하는 도구를 개발하는 것도 있다. 지금까지 경쟁에 활용한 공개 데이터만 1만9000개에 이른다. 이 사이트가 내건 구호는 ‘데이터 과학을 스포츠로 즐기자’다. 데이터 과학을 즐거운 경쟁으로 여기는 이들이 활동한다. 100여 개국에서 참가하는 이들 중엔 컴퓨터 과학자와 통계학자가 많다.
이 캐글에 세계 기업들이 적극적인 관심을 보인다는 게 흥미롭다. 기업에서 해결해야 할 과제를 대학 또는 연구소와 협업하는 대신 캐글에 일정 상금을 걸고 공개 경진을 통해 최고의 솔루션을 얻는 것이다. 문제 해결의 기민함과 속도가 생명인 교통과 의료 부문에서 활발하다. 기업들은 캐글에서 과제를 많이 해결한 전문가를 적극 영입하려 애쓰고 있다.
기업들이 제공한 데이터가 자칫 악용될지 모른다는 리스크도 있다. 하지만 4차 산업혁명의 초연결성을 어떻게 활용하는가가 기업의 경쟁력이 되는 시대다. 캐글러 육성이 정부가 서둘러야 할 부분인 것 같다.
선임기자 ohchoon@hankyung.com
관련뉴스