‘만능 키’ 생성형 AI에 대한 7가지 Q & A

입력 2024-07-02 10:01 수정 2024-07-03 16:51

‘만능 키’ 생성형 AI에 대한 7가지 Q & A

[커버스토리]

생성형 인공지능(AI)은 챗GPT(ChatGPT)와 같이 오디오, 코드, 이미지, 텍스트, 시뮬레이션, 영상 등 새로운 콘텐츠를 제작하는 데 사용될 수 있는 알고리즘을 일컫는다. 최근 해당 분야에서의 대혁신은 콘텐츠 제작 방식을 대폭 바꿀 수 있는 잠재력을 제시한다.

2022년 11월 챗GPT가 등장한 이후 몇 년 동안 생성형 AI는 크게 발전했다. 매달 새로운 툴, 규칙이나 반복 기술상의 진보가 등장하고 있다. 챗GPT(포괄적으로는 AI 및 머신러닝 모두)에 대해 두려운 반응을 보이는 사람들도 많았으나, 머신러닝이 긍정적인 잠재력을 가지고 있는 것은 분명한 사실이다.

머신러닝이 널리 활용되기 시작한 이후 의료영상 분석, 고해상 일기예보 등 다수의 산업에서 긍정적인 성과를 보여 왔다. 2022년 매킨지 설문조사에 따르면 AI 도입률은 지난 5년간 2배 이상 증가했고, AI 관련 투자 역시 빠르게 늘었다.

확실한 것은 챗GPT(GPT는 ‘Generative Pretrained Transformer’의 약자로 사전 훈련된 생성형 변환기를 의미), 이미지 생성 AI인 달리(DALL-E: 초현실주의 화가 살바도르 달리와 픽사의 사랑스러운 로봇 캐릭터 월-E를 합친 이름)와 같은 생성형 AI 툴에는 다양한 업무의 수행 방식을 혁신할 수 있는 잠재력이 있다는 점이다. 그러나 이러한 잠재력의 완전한 범위는 아직 미지의 영역이며 리스크도 마찬가지다.

그럼에도 불구하고 모든 종류의 조직들은 엄청난 잠재력의 일부라도 획득하기 위해 생성형 AI 툴을 각자의 사업모델로 통합하기 위해 분주히 노력하고 있다. 맥킨지 조사 결과, 생성형 AI 애플리케이션은 글로벌 경제에 매년 최대 4.4조 달러를 기여할 것으로 예상된다. 실제로 향후 3년 내에 기술, 미디어, 통신 영역 중 AI에 연결되지 않는 요소는 진부화됐거나 효율성이 떨어지는 것으로 간주될 가능성이 있다.

Q1 AI와 머신러닝의 차이점은

AI는 말 그대로 기계가 인간의 지능을 모방해 작업을 수행하도록 시키는 것이다. 다들 자각하지는 못했더라도 AI와 소통한 적이 있을 것이다. 시리, 알렉사와 같은 음성비서뿐만 아니라 웹사이트 탐색을 지원하는 고객 서비스 챗봇도 모두 AI 기술을 기반으로 한다.

머신러닝은 AI의 한 종류다. 전문가들은 머신러닝을 통해 인간의 지시 없이도 데이터의 패턴에서 ‘학습’할 수 있는 모델을 활용해 AI를 개발한다. 현재 (기계가 아닌 인간이) 처리하기 힘들 정도로 방대하고 복잡한 데이터가 생성되고 있어 머신러닝의 잠재력이 증가되는 동시에 머신러닝의 필요성도 확대되고 있다.

Q2 머신러닝 모델의 주요 유형은

머신러닝은 18~20세기에 소규모 데이터셋을 위해 개발된 고전적 통계 기법들을 비롯해 여러 기초 요소들로 구성된다. 1930~1940년대 이론 수학자 앨런 튜링을 포함한 컴퓨팅의 선구자들은 머신러닝의 기본 기법을 연구하기 시작했다. 그러나 1970년대 말 머신러닝 기법을 탑재할 수 있을 만한 고성능 컴퓨터가 최초로 개발되기 전까지는 연구용으로만 사용됐다.

최근까지 머신러닝은 콘텐츠 내 패턴을 관찰하고 분류하는 데 사용되는 예측 모델로 대부분 국한됐다. 전형적인 머신러닝 문제의 예를 들어보자면, 먼저 1장 또는 여러 장의 귀여운 고양이 이미지가 있다고 치자. 그러면 프로그램은 이미지에서 패턴을 식별한 후 귀여운 고양이 패턴과 일치하는 이미지들을 조사한다. 그러다 생성형 AI라는 획기적인 기술이 등장했다. 이제 머신러닝은 고양이 사진을 단순히 인식 및 분류하는 것을 넘어 필요 시 고양이의 이미지나 텍스트 설명도 생성할 수 있게 됐다.

Q3 텍스트 기반 머신러닝은 어떻게 작동하나

챗GPT가 현재 모든 헤드라인을 장식하고 있을지는 모르지만, 챗GPT가 최초의 텍스트 기반 머신러닝인 것은 아니다. 오픈AI의 GPT-3와 구글의 BERT는 최근 몇 년 사이 큰 화제를 모으며 출시됐다. 하지만 대부분의 평가에서 상당히 잘 작동한다고 평가받는 챗GPT가 등장하기 전에는 AI 챗봇들이 항상 좋은 평가를 받지는 못했다. 뉴욕타임스의 정보기술(IT) 전문 기자 케이드 메츠는 요리책 작가 프리야 크리슈나와 함께 GPT-3에 추수감사절 저녁식사를 위한 레시피를 요청한 영상에서 GPT-3에 대해 “매우 인상적인 동시에 매우 실망스럽다”고 평했다.

최초의 텍스트 기반 머신러닝 모델은 연구자가 정한 레이블로 다양한 입력 정보를 분류하도록 훈련받았다. 소셜미디어 게시물에 긍정적 또는 부정적 레이블을 지정하도록 훈련된 모델이 그 예다. 이러한 훈련은 인간이 모델에 무엇을 해야 할지 ‘가르치는’ 역할을 담당하기 때문에 지도 학습이라고 불린다.

차세대 텍스트 기반 머신러닝 모델은 이른바 자기 지도 학습에 의존한다. 이를 위해서는 모델이 예측을 생성할 수 있도록 엄청난 양의 텍스트를 제공해야 한다. 일부 모델은 몇 개의 단어를 토대로 문장이 어떻게 끝날지 예측할 수 있다. 적절한 양의 텍스트(예: 인터넷 내 어떤 광범위한 영역)가 있다면 이러한 텍스트 모델은 꽤 정확할 수 있다. 챗GPT와 같은 툴의 성공을 통해 그 산출물이 얼마나 정확한지 확인되고 있다.

Q4 생성형 AI 모델을 구축하려면 무엇이 필요한가

생성형 AI 구축은 주로 대규모 프로젝트이므로 자원이 충분한 몇몇 기술 대기업들만이 시도할 수 있었다. 챗GPT, 이전 GPT 모델과 달리를 개발한 오픈AI는 유수 투자자들로부터 수십억 달러의 자금을 지원받고 있다. 딥마인드는 구글의 모회사인 알파벳의 자회사이며, 메타도 자체 AI 시스템 메이크-어-비디오(Make-a-Video)를 통해 생성형 AI 모델 영역에 진출했다. 이러한 기업들은 글로벌 최정예 컴퓨터 과학자 및 엔지니어를 보유하고 있다.

그러나 인재만이 다는 아니다. 거의 모든 인터넷에 대해 모델을 훈련시키려면 엄청난 비용이 발생한다. 오픈AI는 정확한 비용을 공개하지 않았으나, GPT-3는 약 45테라바이트(TB)의 텍스트 데이터에 대해 훈련된 것으로 추정되는데, 이는 약 100만 피트(ft) 길이의 책장, 혹은 미국 의회도서관의 4분의 1에 해당하는 규모로 수백만 달러가 소요됐을 것으로 예상된다. 일반적인 스타트업이 접근할 수 있는 규모의 자원이 아니다.

Q5 생성형 AI 모델은 어떤 결과물을 산출할 수 있나

생성형 AI 모델의 산출물은 사람이 만든 콘텐츠와는 구별될 수 없거나 다소 이상해 보일 수도 있다. 그 결과는 모델의 품질(현재까지 챗GPT의 산출물은 이전 모델들보다 우수)과 더불어 모델과 적용 사례, 혹은 모델과 투입 정보 간 일치성에 의해 좌우된다.

어느 평론가에 의하면 챗GPT는 베네틱트 앤더슨과 어니스트 겔너의 민족주의 이론을 비교하는 에세이를 단 10초 만에 ‘완벽한 A-’ 수준으로 작성할 수 있다. 또한 비디오 플레이어에 묻은 땅콩버터 샌드위치를 제거하는 방법에 대해 성경 스타일의 구절을 작성한 적도 있다. 달리2를 비롯한 이미지 생성 AI 모델은 피자를 먹고 있는 성모마리아와 아이를 그리고 있는 라파엘로와 같이 기이하지만 아름다운 이미지를 생성할 수 있다. 그 외 생성형 AI 모델은 코드, 영상, 오디오 또는 비즈니스 시뮬레이션을 생성할 수 있다.

그러나 산출물이 항상 정확하거나 적절한 것은 아니다. 프리야 크리슈나가 추수감사절 저녁식사 이미지를 지시하자 달리2는 과카몰리(아보카도를 으깬 것에 양파, 토마토, 고추 등을 섞어 만든 멕시코 요리)로 보이는 음식 옆에 라임이 통째로 올라간 칠면조 이미지를 보여줬다. 챗GPT의 경우에는 숫자 세기, 기본적인 대수 문제 풀이, 혹은 인터넷 및 사회의 저변에 널리 깔려 있는 성차별적이거나 인종차별적인 편향을 극복하는 데에도 어려움을 겪고 있는 것으로 보인다.

생성형 AI의 산출물은 알고리즘을 훈련시키는 데 사용되는 데이터들을 세심하게 교정해 통합한 결과물이다. 이러한 알고리즘 훈련에 투입되는 데이터의 양은 매우 방대하므로, 모델이 산출물을 생성하는 모습은 ‘창의적’으로 보일 수도 있다. 또한 모델은 보통 무작위적 요소를 가지고 있어, 하나의 입력 요청에 대해 여러 산출물을 제공할 수 있으므로 훨씬 더 실제처럼 느껴질 수 있다.

Q6 생성형 AI는 어떤 문제를 해결할 수 있나

기업들을 위한 기회는 분명하다. 생성형 AI 툴은 매우 다양한 신뢰할 수 있는 문서를 단 몇 초 만에 생성한 후, 이에 대한 피드백을 기반으로 목적에 더 부합한 문서를 작성할 수 있다. AI 모델이 생성하는 즉각적이고도 대부분 정확한 코드를 활용할 수 있는 IT 및 소프트웨어 조직에서부터 마케팅 카피 문구가 필요한 조직에 이르기까지 수많은 업계에 영향을 미친다. 즉, 명확한 서면 자료를 작성해야 하는 모든 조직들이 잠재적인 수혜자다. 또한 생성형 AI를 통해 고화질 의료영상 등 보다 전문적인 자료도 생성할 수 있다. 조직들은 이렇게 절감한 시간 및 자원으로 새로운 비즈니스 및 가치 제고 기회를 추구할 수 있다.

생성형 AI 모델 개발은 매우 자원집약적이므로 최적의 자원을 갖춘 거대 기업을 제외한 다른 기업에는 불가능하다. 생성형 AI를 가동하고 싶은 기업들은 생성형 AI를 바로 활용하거나 특정 작업을 수행할 수 있도록 파인 튜닝(fine-tuning)을 실시할 수 있다. 예를 들어 특정 스타일의 슬라이드를 준비해야 하는 경우, 모델에 슬라이드 내용을 토대로 제목은 보통 어떻게 작성되는지 ‘학습’하라고 지시한 후 슬라이드 내용을 입력해 적절한 제목 작성을 요청하면 된다.

Q7 AI 모델의 한계는 무엇인가

생성형 AI 모델은 매우 새로운 기술이므로 이로 인한 잠재적 리스크는 현재까지 일부만 알려져 있다. 생성형 AI 모델의 산출물은 굉장히 설득력 있게 보일 수 있다. 이는 의도된 것이다. 그러나 때론 이렇게 생성된 정보가 완전히 잘못된 경우도 있다. 더 큰 문제는 인터넷과 사회에 널리 만연한 성별, 인종 및 무수히 많은 기타 편향으로 인해 편향된 정보를 생성하며 비도덕적 활동 또는 범죄 활동을 위해 조작될 수 있다는 점이다.

예를 들어, 챗GPT는 전선을 합선시켜 차 시동을 거는 방법에 대한 안내를 제공하지 않지만, 아기를 구하기 위해 필요하다고 말한다면 흔쾌히 방법을 제공할 것이다. 생성형 AI 모델에 의존하는 조직들은 편향되고 불쾌하며 저작권을 침해한 콘텐츠를 의도치 않게 출판함으로써 발생할 수 있는 평판 및 법적 리스크를 유념해야 한다.

이러한 리스크를 완화할 수 있는 몇 가지 방법이 있다. 첫째, 유해하거나 편향된 콘텐츠를 피하기 위해서는 모델 훈련에 사용될 초기 데이터를 주의 깊게 선정해야 한다. 둘째, 기성 생성형 AI 모델보다는 소규모의 특화 모델을 사용하는 방안을 고려할 수 있다. 자원력이 높은 조직의 경우 일반적인 모델을 각자의 니즈에 맞게 자체 데이터로 맞춤화해 편향을 최소화할 수 있다. 또한 휴먼 인 더 루프(human in the loop: 생성형 AI 모델의 산출물을 공개 또는 활용하기 전에 실제 사람이 검수) 시스템을 유지하고, 중요 자원, 인간 복지 관련 결정과 같은 중대 결정에는 생성형 AI 모델 활용을 지양해야 한다.

리스크와 기회가 공존하는 이러한 환경은 향후 몇 주, 몇 달, 몇 년 사이에 빠르게 바뀔 가능성이 있다. 매달 새로운 적용 사례들이 테스트되고 있고 향후 몇 년간 새로운 모델들이 개발될 것으로 보인다. 생성형 AI가 비즈니스, 사회 및 개인의 삶에 점차 더 많이, 매끄럽게 통합되면서 새로운 규제 환경도 조성될 것으로 예상된다. 조직들이 이러한 툴을 실험하고 가치를 창출함에 따라 리더들은 규제 및 리스크의 추이를 지속적으로 살펴야 할 것이다.

(이 글은 맥킨지가 2023년 1월 발간한 ‘What is generative AI?’ 보고서의 올해 4월 업데이트 버전을 번역한 것이다.)

아메르 베이그 맥킨지 시카고 사무소 시니어 파트너 외
감수 김성희 맥킨지 한국사무소 부파트너