아밋 제인 "글보다 영상을 보는 시대…AI도 동영상이 대세죠"

입력 2024-12-12 17:28 수정 2024-12-12 17:29

아밋 제인 "글보다 영상을 보는 시대…AI도 동영상이 대세죠"

“사람들은 더 이상 글을 읽는 걸 좋아하지 않습니다. 공부할 때도, 여가를 보낼 때도 영상을 봅니다.”

지난 5일 미국 라스베이거스에서 열린 ‘AWS 리인벤트 2024’에서 만난 아밋 제인 루마AI 공동창업자 겸 최고경영자(CEO)는 “시청각을 바탕으로 한 영상 생성 모델이 보편적인 인공지능(AI) 모델이 될 것”이라며 이같이 말했다. 루마AI는 ‘드림머신’ ‘레이’ 등 모델을 운영하는 세계에서 가장 주목받는 영상 생성 AI 스타트업 중 하나다. 이번 행사에서 루마AI는 실리콘밸리 벤처캐피털(VC)인 앤드리슨호로위츠를 비롯해 아마존, AMD 등으로부터 9000만달러(약 1300억원) 규모의 투자를 유치했다.

최근 AI 시장에 뛰어든 많은 기업은 텍스트 기반 챗봇을 시작으로 이미지, 영상 생성 모델로 나아갔지만 루마AI는 달랐다. 궁극적인 AI 모델은 영상을 기반으로 할 수밖에 없다는 판단에서였다. 창업 전 오랜 시간 애플에서 혼합현실(MR) 헤드셋 ‘비전프로’ 개발자로 근무한 제인 CEO는 “텍스트에 기반한 챗봇은 ‘1세대 AI 모델’일 뿐”이라며 “차세대 AI는 인간 뇌처럼 영상, 음성, 언어, 텍스트를 모두 포함하는 형태로 구축될 수밖에 없다”고 말했다.

빅테크와의 경쟁에서도 자신감을 드러냈다. 제인 CEO는 “단순히 영상 생성이 아니라 높은 품질의 영상을 만드는 것은 매우 어렵다”며 “대기업들은 끊임없이 ‘이런 기술도 있고 이런 모델도 개발했다’고 자랑하지만 결국 기술 발전 단계를 높이는 것은 특정 기술에 완전히 집중한 특화 그룹만 할 수 있다”고 강조했다.

루마AI는 지난 4일 이미지나 텍스트만으로 최대 1분 분량의 영상을 생성하는 모델 ‘레이 2’를 출시했다. 새 모델은 ‘현실성’을 극대화하는 데 집중했다. 제인 CEO는 “AI로 생성된 캐릭터라도 전체적인 인과관계와 정체성을 유지하는 데 초점을 맞췄다”며 “영상 생성 속도도 매우 빠르게 끌어올려 훨씬 더 많은 작업을 할 수 있게 했다”고 말했다. 그는 자사 AI 모델은 영화 제작자 등 특정 분야의 전문가만 타깃으로 하지 않았다고 거듭 강조했다. 모든 사람이 쓸 수 있는 범용 기술을 개발하는 데 초점을 맞췄다는 설명이다.

창업자로서 루마AI로 이루고 싶은 목표를 묻자 “사람들이 창의적으로 생각할 수 있는 힘을 실어주는 것”이라는 추상적인 답변이 돌아왔다. 그는 “AI가 사람들의 일자리를 빼앗고 인간의 일을 모두 대체할 것이라는 말은 바보 같은 소리”라며 “AI는 오직 인간만 지닌 창의력을 더 많이 발휘하도록 도와줘 제2, 제3의 문명을 불러올 것”이라고 자신했다. 이어 “영화 ‘듄’에서처럼 소수의 사람만 기술을 발전시키고 활용하는 세상이 아니라 모두가 활용할 수 있는 기술을 개발하고 발전시키는 것이 CEO로서 목표”라고 덧붙였다.

라스베이거스=송영찬 특파원 0full@hankyung.com