본문 바로가기
ITPE/정보보안

[보안] K-익명성 이란?

by 멍뭉카 2022. 7. 7.
반응형

열쇠 이미지
출처 : 픽사베이, 열쇠 이미지



이것은 무엇인가??

데이터에 동일한 값이 K개 이상 존재할 수 있도록 하여
데이터를 통한 특정 개인을 식별할 수 있는 확률을 낮춰 줄 수 있는
프라이버시 모델 이다

왜 필요한가??

데이터를 공개 시 몇가지 데이터를 조합해서
민감한 정보가 노출되고 또한 그가 누군지 추론이 될 수 있습니다
(이런걸 연결 공격이라고 하더라구요)
이를 방지하기 위해서 비식별화 방법 중 하나인 K-익명성 입니다

1) 왕십리 사는 28살 남자 홍길동씨
2) 왕십리 사는 28살 남자는 전립선병 질환 기록이 있다
3) 홍길동씨는 전립선 질환이 있을 수 있구나~ 라고 유추될 수 있음

예시를 찾아보면

온통 전립선염 이야기 뿐입니다
(어디 책에 나온 이야기인가..)

K익명성 예시1
출처 : 내사진, K익명성 예시1

데이터 공개 시 이렇게 자세하게 한다면
다른 데이터와 유추해서 누가 어느 질병에 걸렸는지
식별할 수 있는 여지가 있지만

K익명성 예시2
출처 : 내사진, K익명성 예시2

이렇게 한다면 누가 어느 질병을 걸렸는지 유추할 수 있는 확률이
1/3으로 낮춰지는걸 알 수 있습니다.(K-3 익명성)
특정 정보를 마스킹 한다거나 나이 표현방식을 변경해서
동일데이터 형태로 일부러 만들어 줍니다

그러면 좀더 안전한 데이터가 될 수 있겠죠??
하지만 안전해질 확률을 높혀줄 뿐 K-익명성에도 취약점이 있는데요

이를 보완하기 위해 L-다양성이 필요합니다.

반응형

댓글