"개발된 검색 경기지수 위기 때 예측력 높아"
한국은행의 재정 지원을 받아 포털 검색어 빈도로 경기를 진단하는 연구가 진행됐다.
연구 결과는 비교적 성공적이었다.
네이버에서 검색된 경기 불황과 호황 관련 주제어의 검색 빈도를 지수화해 한은의 경제심리지수(ESI)와 비교한 결과, 상관계수(최고값 1)는 무려 0.96에 달했고 민간소비나 경제 성장률의 예측에도 유용했다.
이긍희 방송통신대 정보통계학과 교수와 황상필 한은 계량모형부 팀장은 2일 한은 계간지인 '경제분석' 최근호에 실린 '빅데이터를 활용한 경기판단지표 개발-네이버 검색 경기지수 작성과 유용성 검토' 논문에서 이런 연구 결과를 공개했다.
이번 연구는 독감 관련 주제어의 검색빈도로 독감 유행수준을 예측해 빅데이터활용의 유명 사례로 자주 인용되는 '구글 독감 트렌드'처럼 네이버의 검색어 빈도통계 서비스인 '네이버 트렌드'(trend.naver.com)를 활용했다.
경기침체, 불경기, 경기회복 등 경기 불황과 호황 관련 주제어의 검색 빈도를집계해 한은의 기업경기실사지수(BSI) 방식처럼 지수화한 네이버 검색 경기지수를개발한 것이다.
즉, BSI가 긍정적인 응답과 부정적인 응답 비중의 차이를 따져 100을 기준으로경기 판단의 긍정, 부정을 달리하듯이 네이버 검색 경기지수는 2007년 1월부터 작년8월 사이 경기 불황 및 호황 주제어의 검색 빈도를 결합해 만들었다.
이 지수를 한은의 다른 공식 통계와 비교한 결과, BSI와의 상관계수는 0.907, ESI와는 0.960에 달했다. 소비자심리지수(CSI)와의 상관계수는 0.615로 상대적으로낮은 편이었다.
이 지수는 매주 또는 매달 바로 산출할 수 있지만 분기 종료후 약 한달 뒤 국내총생산(GDP) 속보치가 나와야 알 수 있는 분기별 GDP 기준 성장률이나 민간소비 증가율과도 유사한 흐름을 보였다. 특히 금융위기 기간에는 상대적으로 더 뛰어난 예측력을 보여줬다.
경기동행지수 순환변동치 기준 경기 정점과 비교하면 6∼7개월, 저점과는 2∼3개월 선행하는 모습이었다.
이와 관련, 황상필 계량모형부 팀장은 "아직은 분석 시계열이 짧고 주제어의 적절성 등 여러 한계가 있어 공식 통계화하기는 어렵다"면서 "그러나 좀 더 발전시키면 모니터링 지표처럼 내부적으로 사용할 수는 있을 것"이라고 기대감을 내비쳤다.
<표> 네이버 검색 경기지수(NSI)와 GDP 성장률, 민간소비 증가율(CP) 추이 evan@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>
한국은행의 재정 지원을 받아 포털 검색어 빈도로 경기를 진단하는 연구가 진행됐다.
연구 결과는 비교적 성공적이었다.
네이버에서 검색된 경기 불황과 호황 관련 주제어의 검색 빈도를 지수화해 한은의 경제심리지수(ESI)와 비교한 결과, 상관계수(최고값 1)는 무려 0.96에 달했고 민간소비나 경제 성장률의 예측에도 유용했다.
이긍희 방송통신대 정보통계학과 교수와 황상필 한은 계량모형부 팀장은 2일 한은 계간지인 '경제분석' 최근호에 실린 '빅데이터를 활용한 경기판단지표 개발-네이버 검색 경기지수 작성과 유용성 검토' 논문에서 이런 연구 결과를 공개했다.
이번 연구는 독감 관련 주제어의 검색빈도로 독감 유행수준을 예측해 빅데이터활용의 유명 사례로 자주 인용되는 '구글 독감 트렌드'처럼 네이버의 검색어 빈도통계 서비스인 '네이버 트렌드'(trend.naver.com)를 활용했다.
경기침체, 불경기, 경기회복 등 경기 불황과 호황 관련 주제어의 검색 빈도를집계해 한은의 기업경기실사지수(BSI) 방식처럼 지수화한 네이버 검색 경기지수를개발한 것이다.
즉, BSI가 긍정적인 응답과 부정적인 응답 비중의 차이를 따져 100을 기준으로경기 판단의 긍정, 부정을 달리하듯이 네이버 검색 경기지수는 2007년 1월부터 작년8월 사이 경기 불황 및 호황 주제어의 검색 빈도를 결합해 만들었다.
이 지수를 한은의 다른 공식 통계와 비교한 결과, BSI와의 상관계수는 0.907, ESI와는 0.960에 달했다. 소비자심리지수(CSI)와의 상관계수는 0.615로 상대적으로낮은 편이었다.
이 지수는 매주 또는 매달 바로 산출할 수 있지만 분기 종료후 약 한달 뒤 국내총생산(GDP) 속보치가 나와야 알 수 있는 분기별 GDP 기준 성장률이나 민간소비 증가율과도 유사한 흐름을 보였다. 특히 금융위기 기간에는 상대적으로 더 뛰어난 예측력을 보여줬다.
경기동행지수 순환변동치 기준 경기 정점과 비교하면 6∼7개월, 저점과는 2∼3개월 선행하는 모습이었다.
이와 관련, 황상필 계량모형부 팀장은 "아직은 분석 시계열이 짧고 주제어의 적절성 등 여러 한계가 있어 공식 통계화하기는 어렵다"면서 "그러나 좀 더 발전시키면 모니터링 지표처럼 내부적으로 사용할 수는 있을 것"이라고 기대감을 내비쳤다.
<표> 네이버 검색 경기지수(NSI)와 GDP 성장률, 민간소비 증가율(CP) 추이 evan@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>