(서울=연합뉴스) 김유아 기자 = 전문가의 전망 등이 담긴 기사를 실시간으로 활용해 만든 경제지표를 국내총생산(GDP) 성장률 예측 등에 이용하면 정확도가 향상된다는 연구 결과가 나왔다.
한국은행 경제통계국 통계연구반 서범석 과장은 16일 '뉴스텍스트를 이용한 경기 예측: 경제 부문별 텍스트 지표의 작성과 활용' 보고서에서 2005년 1월부터 2022년 3월까지 인터넷 포털사이트에 게재된 기사 100만건(연평균)을 분석해보니 이같이 나타났다고 밝혔다.
'코스피', '상승'과 같은 특정 단어를 포함하는 문장이 등장하는 기사를 추출하고 이들 기사가 전체에서 차지하는 비중을 계산한 뒤 생산, 물가, 고용, 주택가격 등 15개 부문의 경제지표로 작성한 결과다.
보고서에 따르면 이렇게 작성된 뉴스 텍스트 기반 경제지표를 기존 예측모형인 동적인자모형(DFM) 기반 선형모형에 추가하면 'GDP 전년동기대비 증가율 예측' 평균오차는 기존 0.743에서 0.681로 낮아졌다. 예측 정확도가 향상됐다는 뜻이다.
서 과장은 "텍스트 지표는 조사대상 기준일에 즉시 작성 가능해 주로 익월 중순 이후 발표되는 공식 통계보다 입수 시점이 빠르다"면서 "전문가의 전망 등을 반영해 통계적으로 선행성을 갖기 때문에 GDP 예측력 향상에 기여한 것으로 판단된다"라고 말했다.
코로나19 영향이 컸던 2020년 6월 말을 살펴보면 텍스트 지표를 공식 통계에 추가한 경우 2020년 2분기 GDP 예측치가 실제에 더 근접하고, 경제 변수들의 변화를 더 잘 포착했다고 설명했다.
또 작성한 텍스트 지표 대부분은 공식 통계와 높은 상관관계를 보였으며, 0∼9개월 선행하는 것으로도 나타났다.
서 과장은 "기존 정량적 통계 모형만으로는 신속한 경기 예측이 어렵다. 보통 대상 시점과 공표 시점이 달라 한 달 이상 지연이 발생하기 때문"이라며 "그래서 최근 많은 연구가 뉴스텍스트 빅데이터의 중요성을 강조하고 있다"라고 말했다.
이어 "뉴스 텍스트는 다양한 전문가의 견해와 전망 등 정성적 정보를 포함하고 있고 실시간으로 입수할 수 있기 때문에 이를 종합하고 정량화해 경기 예측에 활용할 필요가 있다"고 덧붙였다.
kua@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
관련뉴스