매개변수 70·130·200·500억개로 다양…GPT-3.5보다 '한국어환각' 43% 줄여
기업 맞춤 제공…이경일 대표 "국내외 거대 기업 약 80곳 도입의사"
(서울=연합뉴스) 홍국기 기자 = 국내에서 처음으로 중소기업이 인공지능(AI) 거대언어모델(LLM)을 개발해 공개했다.
솔트룩스[304100]는 7일 서울 강남구 삼성동 코엑스에서 제17회 AI 콘퍼런스 'SAC 2023'을 개최하고 자체 개발한 LLM '루시아(LUXIA)'를 공개했다.
루시아는 AI 데이터 구축과 관련한 정부 사업뿐 아니라 특허청, 행정안전부 등 다양한 분야의 사업을 수행하며 솔트룩스가 축적해온 한글 데이터를 1TB(테라바이트) 이상 학습했다.
이에 따라 데이터 저작권 이슈를 최소화할 뿐 아니라 법률, 특허, 금융, 교육 등 각 전문 분야에 최적화한 맞춤형 언어모델을 빠르고 안전하게 구축할 수 있다.
이경일 솔트룩스 대표는 "2000년에 회사를 창업한 이래 지금까지 23년간 자연어처리(NLP)에 집중하며 대규모 학습 데이터를 구축해왔다"고 강조했다.
루시아는 챗GPT 등 생성 AI의 고질적인 문제로 지적되는 환각(할루시네이션·Hallucination) 현상을 최소화하기 위해 '지식 그래프'(Knowledge Graph)를 활용한 것이 특징이다.
솔트룩스 김재은 랩장은 자사 지식그래프와 연계해 자체 연구·개발한 '인스트럭트 지식 학습'(IKL·Instruct Knowledge Learning)을 통해 오픈AI의 GPT-3.5나 메타의 라마2와 견줘 한국어 환각 현상이 약 43% 줄었다고 설명했다.
아울러 LLM인 루시아에 환각 방지 설루션이 추가된 '루시아GPT'는 매개변수(파라미터) 규모가 70억·130억·200억·500억개로 다양하게 구성돼 기업에서 사용 목적과 예산에 맞춰 합리적인 비용으로 도입할 수 있다.
연말에는 1천억개 규모의 모델도 나올 예정이다.
이 대표는 이날 별도로 마련된 기자간담회에서 하이퍼클로바X와 비교해 루시아의 사양이 떨어지는 것 아니냐는 기자의 질문에 "파라미터 규모가 크면 클수록 좋겠지만, 과연 경제성이 있는지는 따져볼 필요가 있다"며 "네이버가 하이퍼클로바X의 파라미터 규모를 공개하지 않았지만, 추정컨대 1천억개 이하일 가능성이 크다"고 말했다.
그는 루시아의 수익화 방안에 대해 "이미 2개월 전부터 루시아를 도입한 고객사가 있다"며 "본격적으로 10월(내달)부터 내년 6월까지 매출이 빠르게 증가할 것"이라고 내다봤다.
그러면서 "이미 루시아를 도입하겠다는 거대 기업만 국내외 약 80곳"이라고 밝혔다.
아울러 이날 솔트룩스는 루시아GPT를 '미세 조정'(파인 튜닝)해 일반인들이 자유롭게 쓸 수 있는 '루시아 챗, 통합 설루션을 온프레미스(기업의 자체 설비로 보유·운영하는 서버) 형태로 제공할 수 있는 '루시아 엔터프라이즈' 등 루시아GPT가 선도할 AI 생태계의 모습과 비전도 제시했다.
이 대표는 "회사 설립 당시 세상 모든 사람이 자유롭게 지식 소통하는 세상을 만들겠다는 미션을 가지고 출발한 솔트룩스는 이제 루시아를 통해 사람만을 위한 혁신적인 AI 세상을 만들어가고자 한다"고 역설했다.
2000년 창업한 시스메타에 뿌리를 둔 AI 기업 솔트룩스는 2006년 현재의 사명으로 변경하고 2020년 코스닥에 상장했다.
자회사를 포함해 현재 직원 수 약 330명의 중소기업으로, 국내에서 중소기업이 LLM을 개발해 공개한 것은 이번이 처음이다.
솔트룩스(루시아) 외에 국내에서 LLM을 개발한 기업은 네이버(하이퍼클로바·하이퍼클로바X)·카카오(코GPT)·KT(믿음)·SKT[017670](에이닷)·LG(엑사원) 등이다.
이날 SAC 2023 행사에는 약 3천명이 참석해 성황을 이뤘다.
redflag@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
관련뉴스