GPT-4의 가장 큰 특징은 멀티모달 AI라는 점이다. 멀티모달은 다양한 형태의 콘텐츠를 입출력에 활용할 수 있다는 의미다. GPT-3는 텍스트 데이터만 학습해 문자로 물어보면 문자로 답을 얻을 수 있었다. 이에 비해 GPT-4는 이미지를 함께 학습했다. 오픈AI의 이미지 생성 AI인 ‘달리2’처럼 텍스트를 입력하면 이미지를 만들어주는 기능은 없다. 대신 이미지에 담긴 내용과 맥락을 이해해 텍스트 내용과 결합한 답변을 내놓는다.
예를 들어 밀가루, 달걀, 우유 등이 있는 사진과 함께 “이 재료들로 무엇을 만들 수 있을까”라고 질문하면 팬케이크, 와플, 프렌치토스트 등을 제시한다. 고급 추론 기능을 갖춰 복잡한 질문에 답할 수 있다. 그래프 내용을 분석해주기도 하고 유머 사진이 웃긴 이유를 설명하는 것도 가능하다. 오픈AI는 “광범위한 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 해결할 수 있다”고 강조했다.
오픈AI는 챗GPT의 유료 서비스인 ‘챗GPT플러스’를 통해 GPT-4의 기능을 제공하기 시작했다. 기업들도 애플리케이션 프로그래밍 인터페이스(API)를 통해 GPT-4를 자사 서비스에 활용할 수 있게 된다. 오픈AI는 GPT-4를 활용한 서비스도 소개했다. 언어 학습 앱 ‘듀오링고’는 학습용 챗봇을 만드는 데 GPT-4를 도입했다. 덴마크 스타트업 비마이아이즈는 GPT-4의 이미지 인식 기능으로 시각장애인 대상 길 안내 서비스를 제작 중이다.
![](https://img.hankyung.com/photo/202303/AA.32960132.1.jpg)
MS가 코파일럿의 일부 기능을 시연한 영상에선 이용자가 “이 문서를 10장짜리 파워포인트 자료로 만들어줘”라고 입력하자 수초 만에 PPT 파일을 완성해냈다. 엑셀에서 데이터를 분석해 시각화된 자료를 생성하거나 워드를 이용해 비즈니스 제안서를 작성하는 것도 가능하다. 원하는 문서의 초안을 받아 글을 쓰고 자료를 찾아 편집하는 데 들어가는 시간을 줄일 수 있다.
사티아 나델라 MS 최고경영자(CEO)는 “일하는 방식을 근본적으로 바꾸고 생산성 증대의 새 물결을 일으킬 것”이라며 “업무용 코파일럿을 이용하면 자연어를 통해 기술에 더 쉽게 접근할 수 있다”고 했다. MS는 “이번에 내놓은 코파일럿이 기존 MS365에 내장된 챗GPT보다 더 강력하다”고 강조했다. MS는 수개월 안에 코파일럿을 도입한다는 계획이다.
![](https://img.hankyung.com/photo/202303/AA.32960122.1.jpg)
상대방과 여러 번 주고받은 이메일 내용을 AI로 요약하고 보고용 자료를 만드는 기능 등도 소개했다. 기업·기관을 겨냥한 생성형 AI 서비스를 늘린다. 생성형 AI 앱 빌더(구축 도구)도 선보였다. 기업이나 정부 기관 등이 수분에서 수시간 내로 생성형 AI 앱을 만들 수 있게 지원한다는 설명이다. 21일 챗GPT와 같은 대화형 AI ‘바드’도 공개했다.
세일즈포스는 최근 생성 AI ‘아인슈타인GPT’를 공개했다. 세일즈포스의 AI 소프트웨어 플랫폼 아인슈타인을 기반으로 하는 대화형 AI로 고객관계관리(CRM) 지원에 특화했다.
![](https://img.hankyung.com/photo/202303/AA.32960131.1.jpg)
포토샵으로 유명한 어도비도 그림을 그려주는 이미지 생성 AI ‘파이어플라이’를 선보였다. 사용이 허가된 이미지를 기반으로 새로운 이미지를 만들어 저작권 문제에서 자유롭다는 점을 강조했다. 어도비는 포토샵, 일러스트레이터, 프리미어 등 자사 프로그램에 적용해 프로그램 내에서 이미지 생성부터 편집까지 한 번에 할 수 있도록 한다는 계획이다.
이승우 기자 leeswoo@hankyung.com
관련뉴스