페이스북 모회사 메타플랫폼(이하 메타)은 인공지능(AI)을 활용해 단백질 구조를 예측하는 컴퓨터 프로그램 'ESM폴드'(ESMFold)를 개발, 단백질 구조 617만개를 모델화했다고 월스트리트저널(WSJ)이 16일(현지시간) 소개했다.
메타의 연구 자회사 메타 AI는 이날 이 같은 내용을 담은 논문을 과학저널 사이언스에 발표했다.
이 논문의 공동 저자이자 메타 계열사인 메타 AI 소속 과학자 알렉산더 리브스 박사는 단백질 구조를 예측하면 과학자들이 이 구조의 생물학적 기능을 이해하는 데 도움을 줄 수 있다고 말했다.
메타는 앞서 지난해 11월 ESM폴드를 설명하는 논문을 '출판 전 논문 서고' 플랫폼(프리프린트 서버)에 공개한 바 있다.
과학계는 이 프로그램이 생명 작용에 대한 과학자들의 깊이 있는 이해를 도와 신약 개발을 촉진할 것이라고 평가했다.
실제로 EMS폴드는 이미 학계와 연구기관, 바이오기업 등에서 사용하고 있다고 리브스 박사는 소개했다.
메타 연구진들은 몇 개의 글자와 단어만으로 문서를 예측하는 '대규모 언어모델'(LLM)을 활용해 단백질 구조 예측을 생성하는데, 이는 오픈AI의 챗GPT가 인간과 유사한 답변을 생성하는 것과 같은 기술을 활용하는 것이라고 WSJ은 설명했다.
단백질은 끊임없이 접고 또 접히면서 최종 구조를 형성하기 때문에 구조를 결정하는 것은 매우 어렵고 비용이 많이 들어가는 데다 현미경을 사용하면 최대 몇 년이 걸리지만 이처럼 AI를 활용하면 몇시간 또는 며칠 내 가능해진다는 것이다.
단백질은 세포조직과 장기 등의 기능에 필요한 생명체와 의약품 구성요소로, 단백질로 이뤄진 의약품이 심장질환과 암, 인간면역결핍바이러스(HIV) 치료에 이용되고 있어 많은 제약사가 AI를 활용해 신약 개발을 하고 있다.
메타의 ESM폴드는 구글 모회사 알파벳의 자회사인 딥마인드의 단백질 예측 컴퓨터 프로그램 '알파폴드'(AlphaFold)와 경쟁하고 있다.
알파벳은 지난해 알파폴드 데이터베이스(DB)에 신약 개발을 촉진할 수 있는 단백질 예측 모델 2억1천400만개를 보유하고 있다고 밝힌 바 있다.
메타는 ESM폴드가 알파폴드에 비해 60배 빠른 대신 정확성에서는 뒤진다면서 ESM폴드 DB는 기존에 연구되지 않는 유전자 서열로부터 예측 모델을 만들기 때문에 알파폴드보다 훨씬 크다고 설명했다.
미 시카고 소재 바이오 기업 에보자인의 공동창업자이자 시카고대 분자공학과 부교수 앤드루 퍼거슨은 딥마인드와 메타의 AI 예측 모델은 각각의 강점을 가지고 있어 상호보완적이라면서 향후 새로운 발견을 선도할 것이라고 말했다.
(사진=연합뉴스)
한국경제TV 디지털뉴스부 박근아 기자
twilight1093@wowtv.co.kr관련뉴스