지식창고

차분 프라이버시 수학적 정의와 증명

오이시이 2025. 9. 3. 07:26
반응형

차분 프라이버시의 수학적 정의와 증명

수학적 정의

차분 프라이버시는 2006년 Cynthia Dwork이 제안한 이론으로, 다음과 같이 엄밀하게 정의됩니다[1][2]:

ε-차분 프라이버시 정의

두 데이터셋 D₁과 D₂가 단 하나의 레코드만 차이 날 때(인접한 데이터셋), 알고리즘 A가 ε-차분 프라이버시를 만족한다면 모든 출력 집합 S에 대해 다음 부등식을 만족합니다:

Pr[A(D)S]eε×Pr[A(D)S]

여기서:

  • Pr[A(D₁) ∈ S]: 데이터셋 D₁에 알고리즘 A를 적용했을 때 결과가 집합 S에 속할 확률
  • Pr[A(D₂) ∈ S]: 데이터셋 D₂에 알고리즘 A를 적용했을 때 결과가 집합 S에 속할 확률
  • exp(ε): 자연상수 e의 ε승으로, 프라이버시 보호 수준을 결정하는 계수[2]

(ε,δ)-차분 프라이버시 정의

보다 일반화된 정의로, 무작위 함수 K가 (ε,δ)-차분 프라이버시를 만족한다면:

$$ Pr[K(d) ∈ S] ≤ e^ε · Pr[K(d') ∈ S] + δ $$

여기서 d와 d'는 최대 하나의 요소만 차이나는 인접한 데이터베이스입니다[3].

핵심 개념들

프라이버시 예산(Privacy Budget)

ε(입실론)으로 표기되는 프라이버시 예산은 데이터 공개 시 허용 가능한 프라이버시 손실의 상한선을 나타냅니다[2][4]:

  • ε값이 작을수록: 프라이버시 보호 수준 ↑, 데이터 정확도 ↓
  • ε값이 클수록: 프라이버시 보호 수준 ↓, 데이터 정확도 ↑
  • 이론적으로 ε=0: 완벽한 프라이버시 보호(실제로는 불가능)

전역 민감도(Global Sensitivity)

특정 개인을 삽입 또는 제거했을 때 생기는 변화량의 최대값으로, 최악의 경우를 가정합니다[4]:

$$ GS(f) = \max_{d,d'} ||f(d) - f(d')||₁ $$

여기서 d와 d'는 인접한 데이터셋이고, f는 질의 함수입니다.

주요 메커니즘

라플라스 메커니즘(Laplace Mechanism)

가장 기본적인 차분 프라이버시 메커니즘으로[5]:

$$ L(D) = f(D) + Z $$

여기서:

  • f(D): 데이터베이스 D에 대한 함수
  • Z: 평균 0, 분산 b인 라플라스 분포에서 추출한 노이즈
  • b = GS(f)/ε: 스케일 파라미터

익스포넨셜 메커니즘(Exponential Mechanism)

수치가 아닌 카테고리형 출력을 위한 메커니즘으로, 스코어 함수 u:(D×T)→R을 사용하여 출력값을 확률적으로 선택합니다[5].

차분 프라이버시의 수학적 특성

1. 합성 가능성(Composability)

여러 차분 프라이버시 메커니즘을 결합해도 프라이버시 보장이 유지됩니다[2].

2. 포스트 프로세싱 불변성

차분 프라이버시가 적용된 데이터는 추가 처리로도 프라이버시 보장이 파괴되지 않습니다[2].

3. 그룹 프라이버시 보장

개인뿐만 아니라 그룹에 대한 프라이버시도 수학적으로 보장됩니다[2].

이러한 수학적 정의와 특성들을 통해 차분 프라이버시는 데이터 활용성과 개인정보 보호 간의 균형을 정량적으로 제어할 수 있는 강력한 프레임워크를 제공합니다[1][2].

인용:
[1] 차분 프라이버시(Differential Privacy) - ITPE * JackerLabhttps://itpe.jackerlab.com/entry/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9CDifferential-Privacy" target="blank" rel="noopener" data-mce-href=" https://itpe.jackerlab.com/entry/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9CDifferential-Privacy"> https://itpe.jackerlab.com/entry/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9CDifferential-Privacy
[2] 차분프라이버시 모델(Differential Privacy): 데이터 활용과 개인 ...https://rupijun.tistory.com/entry/%EC%B0%A8%EB%B6%84%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-%EB%AA%A8%EB%8D%B8Differential-Privacy-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%99%9C%EC%9A%A9%EA%B3%BC-%EA%B0%9C%EC%9D%B8%EC%A0%95%EB%B3%B4-%EB%B3%B4%ED%98%B8%EC%9D%98-%EA%B7%A0%ED%98%95%EC%A0%90" target="_blank" rel="noopener" data-mce-href=" https://rupijun.tistory.com/entry/%EC%B0%A8%EB%B6%84%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-%EB%AA%A8%EB%8D%B8Differential-Privacy-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%99%9C%EC%9A%A9%EA%B3%BC-%EA%B0%9C%EC%9D%B8%EC%A0%95%EB%B3%B4-%EB%B3%B4%ED%98%B8%EC%9D%98-%EA%B7%A0%ED%98%95%EC%A0%90"> https://rupijun.tistory.com/entry/%EC%B0%A8%EB%B6%84%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-%EB%AA%A8%EB%8D%B8Differential-Privacy-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%99%9C%EC%9A%A9%EA%B3%BC-%EA%B0%9C%EC%9D%B8%EC%A0%95%EB%B3%B4-%EB%B3%B4%ED%98%B8%EC%9D%98-%EA%B7%A0%ED%98%95%EC%A0%90
[3] 차분 프라이버시를 만족하는 안전한 GAN 기반 재현 데이터 ...https://koreascience.or.kr/article/JAKO202031659967758.page" target="_blank" rel="noopener" data-mce-href=" https://koreascience.or.kr/article/JAKO202031659967758.page"> https://koreascience.or.kr/article/JAKO202031659967758.page
[4] 개인정보와 익명화https://statkclee.github.io/privacy/dp.html" target="_blank" rel="noopener" data-mce-href=" https://statkclee.github.io/privacy/dp.html"> https://statkclee.github.io/privacy/dp.html
[5] 차분 프라이버시 (DP, Differential Privacy)https://blog.skby.net/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-dp-differential-privacy/" target="_blank" rel="noopener" data-mce-href=" https://blog.skby.net/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-dp-differential-privacy/"> https://blog.skby.net/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C-dp-differential-privacy/
[6] 차분 프라이버시(Differential Privacy)의 가능성과 한계http://sapi.co.kr/wp-content/uploads/2020/07/03_SNU
-IssuePaper_200629.pdf" target="blank" rel="noopener" data-mce-href=" http://sapi.co.kr/wp-content/uploads/2020/07/03_SNU-IssuePaper_200629.pdf"> http://sapi.co.kr/wp-content/uploads/2020/07/03_SNU_-IssuePaper_200629.pdf
[7] 차등 정보보호 - 3. 차등의 의미 및 수학적 정의http://trvoid.blogspot.com/2025/07/blog-post_18.html" target="_blank" rel="noopener" data-mce-href=" http://trvoid.blogspot.com/2025/07/blog-post_18.html"> http://trvoid.blogspot.com/2025/07/blog-post_18.html
[8] [PDF] 차분 프라이버시 (Differential Privacy)의 가능성과 한계https://sapi.co.kr/wp-content/uploads/2020/05/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C%EC%9D%98-%EA%B0%80%EB%8A%A5%EC%84%B1%EA%B3%BC-%ED%95%9C%EA%B3%84-%EA%B5%AC%EB%B3%B8%ED%9A%A8.pdf" target="_blank" rel="noopener" data-mce-href=" https://sapi.co.kr/wp-content/uploads/2020/05/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C%EC%9D%98-%EA%B0%80%EB%8A%A5%EC%84%B1%EA%B3%BC-%ED%95%9C%EA%B3%84-%EA%B5%AC%EB%B3%B8%ED%9A%A8.pdf"> https://sapi.co.kr/wp-content/uploads/2020/05/%EC%B0%A8%EB%B6%84-%ED%94%84%EB%9D%BC%EC%9D%B4%EB%B2%84%EC%8B%9C%EC%9D%98-%EA%B0%80%EB%8A%A5%EC%84%B1%EA%B3%BC-%ED%95%9C%EA%B3%84-%EA%B5%AC%EB%B3%B8%ED%9A%A8.pdf
[9] 금융 데이터 상에서의 차분 프라이버시 모델 정립 연구https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002293758" target="_blank" rel="noopener" data-mce-href=" https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002293758"> https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002293758
[10] [논문]차분 프라이버시 기반 비식별화 기술에 대한 연구https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201814442074022" target="_blank" rel="noopener" data-mce-href=" https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201814442074022"> https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201814442074022

반응형