14일 업계에 따르면 KT는 최근 개인용 AI 목소리 합성 솔루션인 ‘마이 AI보이스’를 내놨다. 이 서비스는 문장 30개에 대한 녹음 파일을 기반으로 AI 음성을 만들어준다. 데이터만 있다면 유력 정치인과 기업인, 연예인 등의 목소리를 본뜰 수 있다.
KT는 ‘목소리 도둑’을 막기 위해 데이터 확보 단계에 장애물을 뒀다. 녹음 과정에서 무작위로 특정 단어가 들어간 문장을 제시하고, 이용자가 이 문장을 그대로 읊지 않으면 데이터로 받아들이지 않는 방식이다. 회사 관계자는 “예능 프로그램과 드라마, 영화 등으로 타인의 음성을 확보해도 30개의 제시 문장을 정확히 말하기는 사실상 불가능할 것”이라고 했다.
카카오의 영어 기반 AI 그림 합성 앱인 비디스커버는 명령어 제한 방식을 사용하고 있다. 문장을 입력하면 AI가 이미지를 생성하는데, 부적절한 단어를 사용하면 서비스가 작동하지 않는다. ‘따뜻한 음식’을 치면 국밥 등이 나오지만 ‘나체(누드)’를 입력하면 경고 메시지가 뜨면서 이후 절차가 막힌다. 악용을 100% 차단할 수 있는 건 아니다. 단어나 문장을 일부 바꾸는 식으로 제한 조치를 우회할 수 있다.
구글처럼 사용자의 자율성을 강조하는 기업도 있다. 더글러스 에크 구글 선임리서치디렉터는 최근 브리핑에서 “문서 작성 소프트웨어 기업이 개개인이 어떤 글을 쓰는지 관리할 수 없는 것과 같다”고 말했다.
선한결 기자 always@hankyung.com
관련뉴스