구글은 13일 멀티모달 AI 챗봇 제미나이 라이브를 출시했다고 발표했다. 지난 5월 연례 개발자 회의 ‘I/O’ 행사에서 시제품을 공개한 이후 석 달 만이다. 구글의 최신 경량화 대규모언어모델(sLLM) ‘제미나이 1.5 플래시’ 모델을 적용했다. LLM을 활용하는 생성형 AI는 오히려 단순 작업에 더 오랜 시간이 걸린다는 점을 감안했다.
제미나이 라이브는 안드로이드, iOS 등 스마트폰 운영체제(OS)에 특화됐다. 백그라운드에서도 실행될 수 있도록 했고, 휴대폰이 잠겨 있는 상태에서도 계속 대화를 이어갈 수 있도록 했다. 10가지 음성 중 사용자가 원하는 음성을 선택할 수 있게 했다. 안드로이드 OS에서는 전원을 길게 누르거나 “헤이 구글”이라고 말하기만 해도 제미나이 라이브의 도움을 받을 수 있도록 했다.
텍스트뿐 아니라 이미지, 영상, 오디오를 처리할 수 있는 ‘멀티모달 AI’란 점도 눈에 띈다. 예를 들어 여행 브이로그 영상에 나온 식당 목록을 요청하면 제미나이가 이를 구글 지도에 추가해준다.
예상보다 빠른 제미나이 라이브 공개는 오픈AI를 겨냥한 것이란 분석이 나온다. 최근 샘 올트먼 오픈AI 최고경영자(CEO)가 자신의 X(옛 트위터)에 자사의 AI 모델 추론 능력 향상 연구의 코드명이기도 한 ‘딸기’ 사진 한 장을 올리면서 오픈AI의 신형 GPT-5 출시가 임박했다는 관측이 제기됐기 때문이다.
실리콘밸리=송영찬 특파원 0full@hankyung.com
관련뉴스