check 3d gpu
바로가기
왼쪽 메뉴로 이동
본문으로 이동

정보를 통한 해방 혹은 속박

2017년 12월 29일(금) 제536호
박경신 (사단법인 오픈넷 이사·고려대 법학전문대학원 교수) webmaster@sisain.co.kr
공유하기

구글+구글+ 카카오톡카카오톡 카스카스 라인라인 밴드밴드 네이버블로그블로그 URL복사URL복사

URL 복사

아래의 URL을 길게 누르면 복사하실수 있습니다.

- 전혀 상관없어 보이던 데이터베이스들을 합쳐 사회적으로 유용한 통찰을 얻을 수 있다. 그런데 그 정보가 누구에 대한 것인지 알 수 없도록 완벽히 익명화되어야 한다.

최근 과학기술정보통신부가 ‘인공지능 R&D 챌린지’를 열었다. 뉴스 데이터 6000개 중에서 ‘가짜 뉴스’를 찾는 기술력을 평가해 우수 연구팀 3개 팀을 뽑아 연구비 15억원을 지원했다. 2위를 차지한 아이와즈팀 강장묵 교수(남서울대)는 “1년 동안 신문 기사 130만 건을 기계 학습하며 이룬 규칙 기반의 뉴스 기사 분석”을 성공 비결로 밝혔다.

미국 트럼프 대통령 당선과 함께 가짜 뉴스는 인터넷 및 정보기술이 우리 삶을 파괴하는 방식 중 하나로 지적되었는데, 그 가짜 뉴스의 질곡을 바로 인터넷과 정보기술이 해소할 수 있는 가능성을 보여준다. 이 미담의 핵심에는 신문 기사 130만 건, 즉 빅데이터가 있다. 인공지능이 최근 발전하는 것은 인공지능을 훈련시키는 재료가 되는 빅데이터의 출현에 힘입은 바 크다.

전혀 상관없어 보이던 데이터베이스(DB)들을 합쳐, 전에는 몰랐던 통찰을 유추해낼 때 빅데이터는 사회적으로 더욱 유용하다. 예를 들어 건강 정보와 휴대전화 사용 기록을 연결하면 휴대전화에서 나오는 전자파와 암 발병 간의 관계를 밝혀낼 수도 있다. 하지만 이 시나리오에서 우리가 유의할 점이 있다. 건강 정보 DB는 긴요한 의료 서비스를 받기 위해 치료 목적으로 병원에 제공한 정보를 축적해 만들어진다. 그런데 휴대전화 제조사가 안전한 휴대전화 개발에 필요하다며 이를 이용한다면 환자의 사생활 비밀 침해라고 볼 수 있다. 자발적으로 정부기관이나 회사에 제공한 것이라도 정보 제공의 조건과 목적에 반하게 이용되면 정보 유출, 즉 ‘감시’와 다를 바 없다. 이를 막기 위해 자신의 정보를 타인에게 제공할 때 그것이 어떤 목적으로 누구에게 이용되고 공유되는지 통제할 수 있어야 한다(‘개인정보 자기결정권’). 물론 그 정보가 누구에 대한 것인지 알 수 없게 된 상태, 즉 ‘익명화’되어 유출된다면 사생활 비밀 침해는 없을 것이고 개인정보보호법 위반 논란도 사라진다.

ⓒ연합뉴스
8일 오전 경기도 성남시 경기창조경제혁신센터에서 열린 '가짜 뉴스 찾기 인공지능 R&D 챌린지 본선'에서 참가자들이 성능 시연을 하고 있다.

서로 다른 목적으로 축적되어 있는 DB들의 상호 결합을 위해서는 적어도 각 DB의 엔트리(명단) 중에서 동일인의 데이터들을 연결시키는 작업이 필요하다. 예를 들어 A의 휴대전화 사용 기록과 B의 암 발병 여부를 연결해놓은 데이터는 ‘밀려 쓴 답안지’처럼 쓸모없어진다. 그렇다고 실명 정보를 외부에 제공하면 개인정보보호법 위반이다. 이런 이유로 DB 결합은 먼저 각 DB에서 이름과 주민등록번호 등 이른바 ‘개인식별 정보’를 가명으로 전환한다(보통은 일방향 해시함수). 그다음 동일한 가명을 가진 DB 엔트리들을 결합한 후 가명을 떼어낸다. 원본 데이터를 가진 사람은 데이터를 비교해 정보 주체를 찾아낼 수 있으므로 결합된 DB를 익명화하는 기술을 쓴다.

‘빅데이터 개인정보 비식별화 공론화위원회’ 필요

여기에 대해 두 가지 견해가 대치한다. 한쪽에서는 가명 생성 공식을 아는 사람이 존재하는 한 ‘가명화’된 정보는 항상 재식별화될 수 있으므로 익명화가 아니라고 본다. 이는 유럽의 개인정보보호법이 취하는 태도와 비슷한데, 정보 주체들의 동의 없이 새로운 목적으로 그들에 대한 다른 정보와 결합하는 순간 이미 불법적인 ‘목적 외 이용’에 해당되어 불가하다는 것이다. 다른 쪽에서는 신뢰받는 제3자가 가명 생성 방식의 비밀을 유지하면서 DB 결합 서비스를 대신하고, 이후 최대한 익명화 작업을 한다면 어느 누구도 혼자서는 결합 DB를 용이하게 재식별화할 방법이 없으므로 개인정보보호법 위반이 아니라고 주장한다.

우리는 여기서 중요한 가치판단을 해야 한다. 빅데이터는 본질적으로 개인정보보호법을 위반할 소지가 있다. 개인정보 보호는 개인식별 정보를 보관한 자들이 법과 계약을 지킬 것이라는 약속에 어느 정도 기댈 수밖에 없다. 이 약속이 무의미하다면 익명화는 논리적으로 불가능하다(기술적 불가능성 문제는 이 논란에 대해 중립적이다). 빅데이터를 통한 지식 추구라는 장점과 여기서 발생하는 사생활 침해 위험 사이에서 적정한 선을 긋는 공론화위원회와 같은 솔직한 대화가 필요하다. 정보를 통한 해방과 정보를 통한 속박. 두 가지를 모두 잡는 방법을 찾아야 한다.

전체선택후 복사하여 주세요. 닫기