이상형의 외모와 목소리를 가진 인공지능(AI)과 자유롭게 이야기를 나누는 서비스를 상상해본 경험이 있는가. 시간과 장소는 물론 대화 주제에 구애받지 않고 말이다. AI 스타트업 마인드로직을 창업한 2019년을 전후해 자연어 처리(NLP) 분야의 많은 저명인사의 조언을 얻었다. 대화 주제에 제약이 없는 AI를 만들겠다는 포부에 이들은 “불가능한 일이니 다른 사업을 하는 게 나을 것”이라고 답했다.
창업 당시를 기준으로 5년 안에 대화하는 상대방이 사람인지 AI인지 구분할 수 없는 시대가 올 것이라고 확신하던 차였다. 시장 상황은 반대였던 것이다. 창업 후 2년이 채 지나지 않은 시점인 2020년 6월 오픈AI의 초거대 언어모델인 ‘GPT-3’가 등장했다. 과거 부정적 의견을 내던 많은 사람이 “앞으로 수년 내 사람처럼 말하는 AI가 실현될 것”이라는 의견을 피력하고 있다. 2년 만에 격세지감을 느끼게 된 것이다.
물론 ‘컴퓨터 과학의 아버지’ 앨런 튜링 이래로 사람처럼 말하는 기계의 등장에 대한 막연한 기대는 줄곧 있었다. 하지만 사실 이를 체감할 수 있게 하는 실제 서비스들이 등장한 것은 길게 봐도 10여 년밖에 되지 않는다. 사람처럼 말하는 AI를 완성하려는 노력이 어떻게 변모해 왔고, 앞으로 어디를 향하게 될까. AI의 단계별 형태와 패러다임 전환 과정에 그 힌트가 있다.
사용자는 나만의 AI 비서 시리를 처음 본 순간, 자연스럽게 영화 아이언맨의 ‘자비스’를 떠올렸다. 토니 스타크의 지시대로 요술램프 지니처럼 명령을 완벽히 수행하면서도 자연스럽고 위트 넘치게 대화하는 친구 같은 AI를 기대했다. 현실의 AI 비서는 실망감을 안겼다.
세상을 깜짝 놀라게 만든 GPT-3는 2020년 6월 등장했다. 이미 2018년 11월 구글의 ‘BERT’, 2019년 2월 오픈AI의 ‘GPT-2’가 차례로 소개되며 기술 진보가 이뤄졌지만, 일반 대중이 혁신을 체감한 것은 GPT-3였다.
전 세계에서 초거대 생성 언어모델을 개발하는 프로젝트가 앞다퉈 추진되기 시작한다. 국내에서도 동일한 방법론이 적용됐다. 네이버, 카카오를 비롯한 대표 IT 기업들과 정부 지원 프로그램이 초거대 생성 언어모델 개발에 열을 올렸다. 상당히 유의미한 결과물이 도출됐다.
그러나 초거대 생성 언어모델에도 한계는 존재한다. 우선 참조하는 매개변수(파라미터) 수가 급격히 증가함에 따라 추론 속도가 느려지고, 비용이 증가해 서비스 상용화가 쉽지 않다. AI가 상대방과의 대화 내용을 기억하지 못하거나, 앞서 발화한 내용과 상반되는 이야기를 할 수도 있다. AI의 페르소나(대화 주체의 성격이나 개성)가 특정되지 않아 일관성 없는 대화가 이어지는 등의 문제도 산적해 있다.
마인드로직은 현재까지 선보인 바 없는 시도를 병행하고 있다. 마인드로직의 소셜 AI 서비스 ‘오픈타운’은 각각의 유저에 따라 개인화가 가능한 대화형 AI를 제공한다. 사용자들은 자신의 AI를 직접 훈련하고, 본인이 추구하는 특성과 콘셉트에 따라 대화하는 맞춤형 AI를 만들어낼 수 있다. 사용자는 궁극적으로 자신을 대변하는, 새로운 페르소나를 지닌 소셜 AI를 생성하게 된다. 이렇게 탄생한 소셜 AI는 이용자들을 메타버스에 머물게 하며 사람처럼 대화하는 친구가 돼주고 있다.
‘AI는 곧 비서’라는 기존의 지배적 시각은 점차 ‘AI를 사용자의 분신(아바타)’으로 정의하는 새로운 패러다임으로 대체되고 있다. 자신을 대변할 수 있는 개인화된 AI를 보유하고 활용하는 ‘1인 1 AI 시대’가 눈앞에 성큼 다가온 것이다. 이미 개인화된 소셜 AI는 복수의 메타버스 공간에서 동시에 존재하며 시간과 장소에 제약받지 않고 사용자를 대리하는 완벽한 AI 아바타로 거듭나고 있다. 고도화된 서비스를 통해 사용자 경험을 혁신하고 새로운 패러다임을 제시하는 기업만이 사람처럼 대화하는 AI를 완성하려는 꿈에 한 발짝 더 가까이 다가가게 될 것이다.
김용우/김진욱 마인드로직 공동대표
관련뉴스