네이버 '2022 올해 보기'서 국내외 인기 포토존 선정하자 '개인정보 침해 아니냐' 논란
네이버 "개인이 올린 사진 안 봐…누군지 식별 불가능한 익명정보로 포토존 선정"
법률상 누구 것인지 알 수 없는 '익명정보'는 개인정보 해당 안 돼
(서울=연합뉴스) 정성호 기자 이아미 인턴기자 = 포털사이트 네이버가 이용자들이 올린 사진을 이용해 국내외의 인기 포토존(사진 찍는 명소)을 선정해 공개하면서 일각에서 개인정보 침해 논란이 일고 있다.
네이버는 지난 19일 이용자들에게 제공하는 개인용 파일 저장 클라우드(인터넷을 통해 데이터·애플리케이션 등을 저장하거나 내려받아 이용하는 것) 서비스 '마이박스'(MYBOX)의 사용자 통계 등을 정리해 공개하는 'MYBOX 2022 올해 보기' 캠페인을 벌였다.
네이버는 이 캠페인의 일환으로 마이박스 이용자들이 가장 많이 사진을 찍은 국내와 해외의 포토존 상위 10위를 선정했다. 그 결과 국내에서는 약 420만장의 사진이 찍힌 서울 여의도 한강공원이 사계절을 통틀어 가장 인기 있는 사진 촬영 장소였던 것으로 나타났다.
그러자 트위터 등 사회관계망서비스(SNS)에선 "네이버가 사용자들의 사진을 멋대로 분석해 마케팅에 사용했다"며 "기업이 개인용 클라우드 사진을 (임의로 보고) 분석해도 되느냐"는 논란이 일었다.
이용자들이 클라우드에 올린 사적인 사진을 네이버가 들여다보고 사진이 찍힌 장소를 파악한 것 아니냐는 것이다.
이런 의혹은 이 캠페인의 웹사이트에 '해운대 해수욕장', '홍대 앞', '롯데월드' 같은 인기 포토존을 찍은 사진이 섬네일(작은 견본 이미지)로 붙어 표시되면서 더 커졌다. 언뜻 보면 이용자가 클라우드에 올린 사진을 가져다 쓴 것처럼 보이기 때문이다.
네이버는 정말 이용자들의 사진을 들춰본 것일까? 만약 그랬다면 법률적으로는 문제가 없을까?
결론부터 말하면, 네이버는 이용자들의 개별 사진을 열람한 적은 없다고 해명했다. '개인정보 보호법'상으로도 이런 행위는 금지돼 있다. 다만 개별 사진·동영상이 아닌 이런 사진·동영상의 '비(非)식별화 메타데이터'를 활용해 통계적으로 분석하는 것은 가능하다.
메타데이터란, 사진·동영상 파일 등의 데이터에 담긴 콘텐츠의 종류와 촬영 일시, 촬영 장소 따위를 알려주는 데이터를 말한다. 또 비식별화란 가명 처리나 통계 처리, 데이터 마스킹(개인 식별정보의 일부 또는 전부를 다른 정보로 대체해 식별 불가능하게 바꾸는 것) 같은 방법으로 데이터의 일부를 변경해 개인을 식별할 수 없도록 하는 것을 뜻한다.
요컨대 사진·동영상의 비식별화 메타데이터를 이용한다는 것은, 사진·동영상을 직접 본 게 아니라 이런 사진·동영상 파일의 촬영 일시·장소 같은 정보를 누구 것인지 알 수 없게 처리한 뒤 사용하는 것을 가리킨다.
네이버 마이박스 관계자는 연합뉴스와의 통화에서 "'올해 보기' 캠페인 페이지에 사용된 사진은 사용자가 올린 사진이 아니라 마이박스 직원들이 직접 포토존을 방문해 촬영한 것"이라고 밝혔다.
이어 "(인기 포토존 선정을 위한) 통계 작성에는 비식별 메타데이터를 사용했기 때문에 사용자가 누구인지 알 수 없다"며 "시스템상으로 직원이 개인의 마이박스를 들여다보는 것은 불가능하다"고 말했다.
이번 마이박스 통계 분석에서 사용된 메타데이터는 디지털카메라 사진에 흔히 사용되는 이미지 파일의 메타데이터 포맷인 'EXIF' 포맷이다.
네이버는 이미 이용자들에게 이런 데이터를 활용하겠다는 사실을 고지해왔다. 네이버 마이박스는 이용 약관에서 서비스 이용 통계, 맞춤 서비스 제공 등에 이용하기 위해 파일 메타 정보를 수집할 수 있다고 밝히고 있다.
하지만 비식별 메타데이터를 단순히 수집하는 것과, 이를 통계 처리해 캠페인에 활용하는 것은 다른 문제다. 그렇다면 수집된 비식별 메타데이터를 사용자 동의 없이 통계로 처리하는 것은 괜찮을까?
결론적으로 특정한 개인을 식별하기 힘든 개인정보라면 해당 개인에게 동의를 얻지 않았더라도 시장 조사처럼 상업적 목적인 경우를 포함해서 통계 작성 등에 이용할 수 있다.
다만 법률적으로 엄격히 따지고 들면 이처럼 비식별화된 정보가 얼마만큼 식별이 어려운가에 대한 정도에 따라 다소 차이가 있다.
개인정보보호법이 보호하는 개인정보는 비식별화되지 않은 정보는 물론 비식별화됐더라도 추가정보를 사용하거나 결합하면 특정 개인을 알아볼 수 있는 '가명정보'까지 포함한다.
가명정보는 개인정보의 일부를 삭제하거나, 일부 또는 전부를 대체하는 가명 처리가 이뤄진 정보를 말한다.
반면 다른 정보를 사용해도 더 이상 개인을 알아볼 수 없는 정보는 '익명정보'로 분류되며 이는 법률상 개인정보가 아니다. 다시 말해 개인을 식별할 수 없는 정보라면 통계 작성이나 과학적 연구 같은 목적에는 이용해도 문제가 되지 않는다.
다만 이런 구분은 이론적인 것으로, 현실에선 이 둘을 명쾌하게 나누기 어렵다. 익명정보로 분류됐던 정보라도 시간·비용·기술 같은 자원을 무한히 투입하면 개인을 식별할 수도 있기 때문이다.
이 때문에 개인정보보호법은 "시간·비용·기술 등을 합리적으로 고려할 때 다른 정보를 사용해도 더 이상 개인을 알아볼 수 없는 정보"를 법 적용 대상이 아니라고 규정하고 있다. '합리적으로'라는 단서를 붙인 것이다.
이에 따라 통상 익명정보인지를 판정할 때는 외부 전문가로 구성된 평가단이 다른 정보와의 결합 가능성을 판단해 안전성을 검증한다.
네이버 사례의 경우 이용자를 식별하지 않은 상태에서 통계를 작성했다. 마이박스 관계자는 "마이박스 통계치는 어떤 방식으로도 개인 식별이 불가능한 데이터, 즉 익명정보에 해당한다"고 설명했다.
실제로 여러 정보기술(IT) 기업은 이미 익명정보나 가명정보에 해당하는 메타데이터를 통계 자료화해 사용하고 있다.
SK텔레콤은 위치 기반 데이터 분석기술인 '리트머스'(LITMUS)를 통해 올해 국내 대표 업무지구 11곳의 인구 통계, 출퇴근, 이동 등을 비교 분석한 '대한민국 오피스 지도'를 공개한 바 있다.
또 카카오는 '2021 카카오모빌리티 리포트'에서 자사 내비게이션의 운행 데이터를 분석해 사용자들이 4∼5월에 세차장을 많이 찾았다는 이용 패턴을 밝혀내기도 했다.
전응준 법무법인 린 변호사는 "EXIF에 있는 정보만을 가지고 이를 개인정보로 보긴 어렵다"라며 "하지만 외부 정보와 조합하면 식별이 완벽하게 불가능하다고 볼 순 없기 때문에 이 경우 (개인정보 보호와 관련된) 기업의 내부 통제나 규준을 봐야 한다"고 말했다.
기업이 사용자들의 정보를 처리하는 과정에서 개별 정보와 관리자 간 분리를 명확하게 지켜 데이터가 식별 가능한 상태가 되지 않도록 유지하는 규율 마련이 필요하다는 것이다.
이러한 우려에 대해 네이버 마이박스는 "개인을 식별할 수 있는 사진의 위치 정보 등 부가정보 또한 본인만 확인할 수 있도록 공인된 외부 기관의 감사 및 엄격한 보안 정책에 따라 관리되고 있다"고 밝혔다.
그럼에도 클라우드 서비스를 둘러싼 개인정보 침해 논란은 끊이지 않는 추세다.
지난 4월 미국 일리노이주에서는 생체정보 보호법(BIPA)이 제정된 후 구글포토 앱의 얼굴 인식 기능 등이 위법하다는 집단소송이 제기됐다. 당시 구글은 1억달러(약 1천269억원)의 합의금을 물기로 합의했다.
작년에는 애플이 미국에서 아이클라우드에 사용자가 올린 사진에서 아동 성착취물(CSAM)을 감지하는 시스템을 도입하려다 보안 전문가와 프라이버시 옹호론자 등의 반대에 부딪혀 이를 보류한 바 있다.
국내에서도 네이버 마이박스는 물론 구글 드라이브, 아이클라우드, 원드라이브, 드롭박스 등 파일 저장 클라우드 서비스가 보편화된 상황에서 기업들의 개인정보 리스크 관리가 더 강화돼야 한다는 의견이 나온다.
네이버는 마이박스 올해 보기 캠페인을 예정대로 이달 31일까지 진행한다. 하지만 논란 탓인지 당초 올라왔던 '네이버 연말결산' 메인 페이지에서는 사라졌다.
meteor3021@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
관련뉴스