최근 개봉한 영화 ‘터미네이터: 다크페이트’엔 한때 ‘꽃미모’를 자랑했던 배우 에드워드 펄롱이 나온다. 진짜 펄롱은 아니다. 전성기 시절 얼굴에 다른 배우를 감쪽같이 합성했다. 인공지능(AI)으로 진화한 컴퓨터 그래픽의 힘이다. AI가 ‘창조’할 수 있는 것은 배우만이 아니다. 옷을 바꿔입으며 맵시를 뽐내는 모델도 척척 만들어낸다.
KAIST는 15일 경기 성남시 판교테크노밸리 글로벌R&D센터에서 연 ‘AI 플래그십 공개워크숍’에서 이 같은 AI 신기술을 대거 공개했다.
재학습이 필요 없는 스마트 AI
AI 알고리즘인 인공신경망(ANN)은 입력에서 출력까지의 연산이 한 방향으로 흐른다. 이 때문에 ‘피드 포워드 넷(FFNet)’이라고도 부른다. 현재 대표적인 AI 알고리즘 중 하나인 컨볼루션신경망(CNN)은 수학의 선형대수(행렬과 벡터)에 바탕을 두고 있다. 학습하는 수백만~수천만 개 이미지 각각의 특징을 벡터로 추출해 비교분석한 뒤 결과값 역시 벡터로 내놓는다. 이미 우리에게 친숙한 ‘얼굴인식 시스템’ 역시 이 원리에 기반한다.
통상 CNN은 정해진 분량만 학습이 가능하다. 1000명 얼굴에 대한 학습을 끝내고 결론을 내렸는데, 1001번째 얼굴을 추가로 배우게 하려면 알고리즘을 재설계해야 한다는 얘기다.
김종환 KAIST 전기전자공학부 교수(로봇지능기술연구소장)는 이런 과정이 필요 없는 새로운 CNN 기술을 개발했다. 추가하는 얼굴만을 신속하게 따로 인식하는 ‘CNN-OICRN(온라인 증가분 식별 네트워크)’이다. ‘특징 벡터’를 새로 설계하는 과정에서 이런 기술이 나왔다. 김 교수는 “실험 결과 추가하는 얼굴에 대한 학습 시간은 10초 내외, 정확도도 98% 이상으로 확인됐다”고 설명했다.
주방에서 레시피 척척?
인간의 장기 기억 구조를 모방한 ‘레시피 추천 AI’도 이날 소개됐다. 인간의 기억(메모리) 구조는 몇 가지로 나뉜다. 특정 사건을 기억하는 ‘에피소드’, 의미를 기억하는 ‘시맨틱’, 희로애락을 기억하는 ‘이모셔널’ 등이다. 볶음밥 조리를 예로 들면 팬에 기름을 두르고, 계란을 깨서 넣고, 양파 등 재료를 볶는 등 일련의 행위가 모두 에피소드 메모리에 근간해 이뤄진다.
김 교수는 ‘에피소드메모리(EM)-개발공명 네트워크(DRN)’라는 새로운 알고리즘으로 레시피 추천 AI를 구현할 수 있다고 설명했다. 내로라하는 셰프들의 조리과정을 에피소드로 분류해 입력값으로 가공하고, 이를 AI 알고리즘으로 구현해 주방 시스템에 넣는 방식이다.
김 교수가 개발한 DRN 알고리즘의 가장 큰 특징은 ‘공명’, 즉 상호작용이다. 정해진 레시피만을 가르쳐주는 게 아니라 이용자가 새 요리법을 시도하면 이를 저장, 학습해 기존과는 다른 레시피를 추천해줄 수 있다. 요리하는 사람의 행동이나 말을 감지하는 센서 등을 통해 음성이나 영상을 추출해 데이터로 활용한다는 얘기다. 김 교수는 “공명을 알고리즘에 구현하기 위해 새로운 수학적 기법을 적용했다”고 말했다.
양이 기린으로 완벽히 둔갑
최신 AI 알고리즘 일종인 적대적 생성 신경망(GAN)을 업그레이드한 기술도 주목받았다. 2014년 등장한 GAN은 ‘거짓 데이터(또는 이미지)’를 만드는 기계학습 모델과 이를 감별하는 모델이 경쟁하면서 ‘참 데이터’를 찾아가는 알고리즘이다. 실사와 전혀 분간이 안 되는 사람 사진을 스스로 만들어내는 것으로 유명하다. GAN을 활용하면 사진 속 모델이 입은 바지를 스커트로, 투피스를 원피스로, 평상복을 속옷으로 감쪽같이 바꿀 수 있다. 얼룩말을 보통 말로, 풍경 사진을 수채화 또는 수묵화로 완전히 바꾸는 것도 가능해진다. 동영상도 마찬가지다.
GAN의 약점은 사진에 여러 개체가 나타날 때 드러난다. 변환 능력이 떨어져 결과물이 조악해지기 쉽다. 신진우 KAIST 기계지능및로봇공학다기관지원연구단 교수는 이 같은 GAN 단점을 보완한 ‘인스타 GAN’을 공개했다. 인스타 GAN을 쓰니 심지어 ‘양’이 ‘기린’으로 감쪽같이 바뀌었다. 신 교수는 “패션산업에서 여러 착용샷을 생성하는 등 활용 분야가 무궁무진하다”고 설명했다.
똑똑한 AI 대화 요원을 만들자
AI 스타트업(신생 벤처기업) ‘보리’는 이날 행사에서 재귀신경망(RNN)을 이용한 AI 응답률 개선기술을 제안했다. FFNet과 달리 반복학습이 가능한 RNN은 문장 분석에 특화된 AI 알고리즘이다.
보리 관계자는 “기존 스마트폰 대화 에이전트는 정형적 대화만 가능하고 질의응답도 한 차례로 끝나는 등 연속적 대화가 쉽지 않다”며 “다양한 대화 시나리오를 수집해 현재 트렌드가 반영된 대화를 끊김 없이 진행하는 게 목표”라고 말했다.
보리는 이를 위해 트위터 대화, 유튜브 영상 등 각종 소셜미디어(SNS) 내 빅데이터를 수집 분석하고 있다. “요즘 인기 있는 웹툰이 뭐야?”라는 질문에 답을 했을 때 “그거 노잼(재미없어). 다른 건?”이란 반응이 나오면 새로운 웹툰을 연속해서 추천할 수 있게 하겠다는 설명이다.
이해성 기자 ihs@hankyung.com
관련뉴스