"글로 쓰면 동영상 만든다"…오픈AI, '소라' 하반기 일반인에 공개

입력 2024-03-14 08:44 수정 2024-03-14 09:03

"글로 쓰면 동영상 만든다"…오픈AI, '소라' 하반기 일반인에 공개

이 기사는 국내 최대 해외 투자정보 플랫폼 한경 글로벌마켓에 게재된 기사입니다.

챗GPT 개발사 오픈AI가 텍스트를 입력하면 동영상으로 만들어주는 인공지능(AI) 모델 ‘소라(Sora)’를 올해 하반기 일반인에게 공개할 전망이다.

미라 무라티 오픈AI 최고기술책임자(CTO)는 13일(현지시간) 월스트리트저널(WSJ)과 인터뷰에서 "올해 (대중들이) 소라를 이용할 수 있을 것"이라며 "몇 달 후가 될 수도 있다"고 밝혔다.

무라티 CTO는 구체적인 시기는 언급하지 않았다. WSJ는 "오픈AI가 올해 하반기에 소라를 공식적으로 출시할 것으로 보인다"고 전망했다.

소라는 프롬프트를 입력하면 동영상을 생성하는 '텍스트 투 비디오'(Text to Video) 형식의 AI 모델이다. 오픈 AI는 지난달 소라를 처음 공개한 이후 '제한된 수의 창작자'만 사용할 수 있도록 허용하고 있다.

무라티 CTO는 소라가 생성하는 동영상을 더욱 사실적으로 만들기 위해 "음향을 통합할 계획"이라고 설명했다. 또 이용자가 원하는 콘텐츠를 만들 수 있도록 "소라가 생성한 동영상 콘텐츠를 이용자가 편집할 수 있도록 하는 방안도 고민하고 있다"고 전했다.

무라티 CTO는 소라 훈련에 어떤 데이터를 사용했는지에 대해서는 "공개적으로 이용할 수 있거나 허가된 데이터"라고만 답했다. 이어 그는 오픈AI가 파트너십을 맺고 있는 이미지·영상 콘텐츠 업체인 셔터스톡(Shutterstock)의 콘텐츠를 사용한다고 설명했다.

이는 오픈AI의 저작권 침해 논란을 의식한 발언으로 보인다. 뉴욕타임스(NYT)는 지난해 말 미국 주요 언론사 중 최초로 오픈AI를 상대로 저작권 침해 소송을 냈다. 연간 수억달러를 들여 고용하고 있는 언론인 수천 명이 만들어 낸 고유 저작물 수백만개를 불법적으로 복제하고 사용했다는 이유에서다.

또한 무라티 CTO는 소라를 구동하는 데에는 다른 AI 도구를 구동하는 것보다 "훨씬 더 큰 비용이 든다"며 오픈AI의 이미지 생성 AI인 '달리'(DALL-E)와 비슷한 비용으로 사용할 수 있도록 만들려고 노력하고 있다고 말했다.

무라티 CTO는 올해 미 대선을 비롯해 전 세계적으로 선거가 열리면서 생성 AI를 이용한 가짜뉴스가 확산한다는 우려에 대해선 "소라가 출시되면 '달리'의 정책과 마찬가지로 공인의 이미지는 생성할 수 없을 것"이라며 "동영상에는 실제와 구별하기 위한 워터마크가 표시될 것"이라고 말했다.

오픈AI는 이런 우려를 의식해 소라를 일반인에 출시하기 전에 전문가팀에 맡겨 안전성 여부를 평가할 계획이다.

한편 지난달 오픈AI는 소라를 공개하면서 "여러 캐릭터와 특정 유형의 동작, 복잡한 장면을 생성할 수 있다"며 "언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다"고 설명했다. 소라는 현재 최대 1분 길이의 동영상을 만들 수 있다.

소라는 텍스트만으로 동영상을 생성할 수 있고 기존의 이미지를 동영상으로도 생성할 수도 있다. 기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다.

신정은 기자 newyearis@hankyung.com