지식창고

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

오이시이 2025. 8. 20. 00:36
반응형

 ㅁ 생성AI 알고리즘과 프라이버시 보호를 연구집

  1.   생성AI 알고리즘과 프라이버시 보호를 연구 - 2010년대
  2.  생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2014
  3.   생성AI 알고리즘과 프라이버시 보호를 연구 - 2015~2017년
  4.  생성AI 알고리즘과 프라이버시 보호를 연구 - 2018~2020년
  5.  생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년
  6.  생성AI 알고리즘과 프라이버시 보호를 연구  - 2024~2025년
  7.  생성AI 알고리즘과 프라이버시 보호를 연구  -  2010~2025
  8.   생성AI 알고리즘과 프라이버시 보호를 연구  - 2020~2025 최신/보충

 

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

연도별 주요 연구 동향 요약

  • 2010년대 초반: Differential Privacy (차등 프라이버시)와 머신러닝 결합 연구 시작.
  • 2014~2017년: GAN(Generative Adversarial Network) 등장, 이미지/텍스트 생성과 프라이버시 유출 취약점 분석 논문 증가.
  • 2018~2020년: DeepFake, Text-to-Speech와 같은 실제 활용 관련 프라이버시 위협 연구.
  • 2021~2025년: Diffusion Models, ChatGPT, LLaMA 계열 대규모 언어 모델(LLMs)에서 데이터 투명성, 개인정보 학습 문제, 데이터 탈식별화 연구 증가.

이 시기는 대규모 언어모델(LLM, GPT-3/4, LLaMA 등)Diffusion Models(Stable Diffusion, DALL·E 2 등)이 등장하며 데이터 프라이버시 유출이 큰 논의가 된 시기입니다.
또한, 멤버십 추론, 데이터 추출 공격(model extraction), Prompt Injection에 대응하기 위한 방어 기법(DP-SGD, noise, fine-tuning with regularization)들이 제시되었습니다.


🔹 4차 정리 (2021~2023년, 총 15편)

                     
발행년도 생성 데이터 유형 프라이버시 수준 생성모델명 비교 검토 모델 모델의 취약점 개선 방어 기술 구현 기술 난이도 성능수준 연구 논문명 (APA)
2021 텍스트 높음 GPT-3 BERT, T5 훈련 데이터 유출 (text memorization) Differential Privacy, Data Filtering Transformer, DP 매우 높음 매우 높음 Brown et al. (2021). GPT-3. NeurIPS.
2021 이미지 중간 VQGAN + CLIP GAN, VAE 이미지 유사 데이터 복원 Embedding Noise GAN, VAE, Transformer 높음 높음 Esser et al. (2021). VQGAN-CLIP. CVPR.
2021 의료 데이터 높음 DP-GAN (EHR) medGAN 환자 데이터 재식별 Differential Privacy Noise GAN, DP, NN 높음 Zhang et al. (2021). DP-GAN Healthcare. JBI.
2021 음성 중간 Conformer TTS WaveNet 화자 유출 Voice Conversion Privacy Masking RNN, Transformer 높음 높음 Gulati et al. (2021). Conformer. Interspeech.
2021 코드 데이터 높음 Codex GPT-3 private repo memorization Filtering, DP regularization LLM (Transformer) 매우 높음 매우 높음 Chen et al. (2021). Codex. arXiv.
2022 이미지 중간 Imagen DALL-E, VQGAN 학습데이터 memory leak Prompt Perturbation Diffusion, Transformer 매우 높음 매우 높음 Saharia et al. (2022). Imagen. CVPR.
2022 이미지 높음 DALL·E 2 CLIP, VQGAN 프롬프트 기반 원본 데이터 복원 Output Filtering Diffusion, Transformer 매우 높음 매우 높음 Ramesh et al. (2022). DALL·E 2. arXiv.
2022 이미지 높음 Stable Diffusion GAN, VAE 훈련 이미지 inversion Latent Perturbation, Noise Injection Latent Diffusion 높음 Rombach et al. (2022). Latent Diffusion Models. CVPR.
2022 텍스트 높음 GPT-J, GPT-NeoX GPT-2, GPT-3 데이터 memorization DP fine-tune, blacklist filtering Transformer 높음 높음 Black et al. (2022). GPT-J. arXiv.
2022 이미지+텍스트 높음 Parti Imagen dataset leakage Secure training pipelines Diffusion, Transformer 매우 높음 매우 높음 Yu et al. (2022). Parti. arXiv.
2022 텍스트 높음 LLaMA GPT-3 학습데이터 포함 개인정보 유출 Content Moderation, DP Transformer 매우 높음 매우 높음 Touvron et al. (2022). LLaMA. arXiv.
2023 텍스트 높음 ChatGPT GPT-3.5 개인데이터 질문에 노출 RLHF, Safety filtering Transformer, RLHF 매우 높음 매우 높음 OpenAI (2023). ChatGPT. OpenAI Blog/Tech Report.
2023 멀티모달 높음 GPT-4 GPT-3, DALL-E2 데이터 추출 Fine-tuning with DP Transformer, Multimodal 매우 높음 매우 높음 OpenAI (2023). GPT-4 Technical Report. arXiv.
2023 이미지 중간 Stable Diffusion 2 Stable Diffusion, DALL-E2 membership inference Noise injection, prompt filtering Latent Diffusion 높음 Rombach & Stability AI (2023). Stable Diffusion 2. arXiv.
2023 텍스트 높음 BLOOM GPT-J, GPT-NeoX multilingual leakage DP-SGD, alignment Transformer LM 매우 높음 높음 BigScience (2023). BLOOM. ACL.

 

 

 

🔹 참고문헌 (2021~2023, 15편)

  1. Brown, T. B., et al. (2021). Language models are few-shot learners (GPT-3). In NeurIPS.
  2. Esser, P., et al. (2021). Taming transformers for high-resolution image synthesis (VQGAN-CLIP). In CVPR.
  3. Zhang, Y., et al. (2021). Ensuring differential privacy in GAN-based EHR synthesis. Journal of Biomedical Informatics.
  4. Gulati, A., et al. (2021). Conformer: Convolution-augmented Transformer for speech recognition. In Interspeech.
  5. Chen, M., et al. (2021). Evaluating large language models trained on code (Codex). arXiv:2107.03374.
  6. Saharia, C., et al. (2022). Imagen: Photorealistic text-to-image diffusion models. In CVPR.
  7. Ramesh, A., et al. (2022). Hierarchical text-conditional image generation (DALL·E 2). arXiv:2204.06125.
  8. Rombach, R., Blattmann, A., et al. (2022). High-resolution image synthesis with Latent Diffusion Models. In CVPR.
  9. Black, S., et al. (2022). GPT-J and GPT-NeoX technical report. arXiv:2204.06745.
  10. Yu, J., et al. (2022). Scaling autoregressive image models (Parti). arXiv:2206.12356.
  11. Touvron, H., et al. (2022). LLaMA: Open and efficient foundation language models. arXiv:2302.13971.
  12. OpenAI. (2023). ChatGPT: Optimizing language models with human feedback. OpenAI Technical Report.
  13. OpenAI. (2023). GPT-4 Technical Report. arXiv:2303.08774.
  14. Rombach, R., & Stability AI. (2023). Stable Diffusion 2. arXiv preprint.
  15. BigScience Workshop. (2023). BLOOM: A 176B-parameter open-access multilingual LLM. In ACL 2023.

반응형