반응형
ㅁ 생성AI 알고리즘과 프라이버시 보호를 연구집
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2010년대
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2014
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2015~2017년
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2018~2020년
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2024~2025년
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2025
- 생성AI 알고리즘과 프라이버시 보호를 연구 - 2020~2025 최신/보충
생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년
연도별 주요 연구 동향 요약
- 2010년대 초반: Differential Privacy (차등 프라이버시)와 머신러닝 결합 연구 시작.
- 2014~2017년: GAN(Generative Adversarial Network) 등장, 이미지/텍스트 생성과 프라이버시 유출 취약점 분석 논문 증가.
- 2018~2020년: DeepFake, Text-to-Speech와 같은 실제 활용 관련 프라이버시 위협 연구.
- 2021~2025년: Diffusion Models, ChatGPT, LLaMA 계열 대규모 언어 모델(LLMs)에서 데이터 투명성, 개인정보 학습 문제, 데이터 탈식별화 연구 증가.
이 시기는 대규모 언어모델(LLM, GPT-3/4, LLaMA 등)과 Diffusion Models(Stable Diffusion, DALL·E 2 등)이 등장하며 데이터 프라이버시 유출이 큰 논의가 된 시기입니다.
또한, 멤버십 추론, 데이터 추출 공격(model extraction), Prompt Injection에 대응하기 위한 방어 기법(DP-SGD, noise, fine-tuning with regularization)들이 제시되었습니다.
🔹 4차 정리 (2021~2023년, 총 15편)
발행년도 | 생성 데이터 유형 | 프라이버시 수준 | 생성모델명 | 비교 검토 모델 | 모델의 취약점 | 개선 방어 기술 | 구현 기술 | 난이도 | 성능수준 | 연구 논문명 (APA) |
2021 | 텍스트 | 높음 | GPT-3 | BERT, T5 | 훈련 데이터 유출 (text memorization) | Differential Privacy, Data Filtering | Transformer, DP | 매우 높음 | 매우 높음 | Brown et al. (2021). GPT-3. NeurIPS. |
2021 | 이미지 | 중간 | VQGAN + CLIP | GAN, VAE | 이미지 유사 데이터 복원 | Embedding Noise | GAN, VAE, Transformer | 높음 | 높음 | Esser et al. (2021). VQGAN-CLIP. CVPR. |
2021 | 의료 데이터 | 높음 | DP-GAN (EHR) | medGAN | 환자 데이터 재식별 | Differential Privacy Noise | GAN, DP, NN | 높음 | 중 | Zhang et al. (2021). DP-GAN Healthcare. JBI. |
2021 | 음성 | 중간 | Conformer TTS | WaveNet | 화자 유출 | Voice Conversion Privacy Masking | RNN, Transformer | 높음 | 높음 | Gulati et al. (2021). Conformer. Interspeech. |
2021 | 코드 데이터 | 높음 | Codex | GPT-3 | private repo memorization | Filtering, DP regularization | LLM (Transformer) | 매우 높음 | 매우 높음 | Chen et al. (2021). Codex. arXiv. |
2022 | 이미지 | 중간 | Imagen | DALL-E, VQGAN | 학습데이터 memory leak | Prompt Perturbation | Diffusion, Transformer | 매우 높음 | 매우 높음 | Saharia et al. (2022). Imagen. CVPR. |
2022 | 이미지 | 높음 | DALL·E 2 | CLIP, VQGAN | 프롬프트 기반 원본 데이터 복원 | Output Filtering | Diffusion, Transformer | 매우 높음 | 매우 높음 | Ramesh et al. (2022). DALL·E 2. arXiv. |
2022 | 이미지 | 높음 | Stable Diffusion | GAN, VAE | 훈련 이미지 inversion | Latent Perturbation, Noise Injection | Latent Diffusion | 중 | 높음 | Rombach et al. (2022). Latent Diffusion Models. CVPR. |
2022 | 텍스트 | 높음 | GPT-J, GPT-NeoX | GPT-2, GPT-3 | 데이터 memorization | DP fine-tune, blacklist filtering | Transformer | 높음 | 높음 | Black et al. (2022). GPT-J. arXiv. |
2022 | 이미지+텍스트 | 높음 | Parti | Imagen | dataset leakage | Secure training pipelines | Diffusion, Transformer | 매우 높음 | 매우 높음 | Yu et al. (2022). Parti. arXiv. |
2022 | 텍스트 | 높음 | LLaMA | GPT-3 | 학습데이터 포함 개인정보 유출 | Content Moderation, DP | Transformer | 매우 높음 | 매우 높음 | Touvron et al. (2022). LLaMA. arXiv. |
2023 | 텍스트 | 높음 | ChatGPT | GPT-3.5 | 개인데이터 질문에 노출 | RLHF, Safety filtering | Transformer, RLHF | 매우 높음 | 매우 높음 | OpenAI (2023). ChatGPT. OpenAI Blog/Tech Report. |
2023 | 멀티모달 | 높음 | GPT-4 | GPT-3, DALL-E2 | 데이터 추출 | Fine-tuning with DP | Transformer, Multimodal | 매우 높음 | 매우 높음 | OpenAI (2023). GPT-4 Technical Report. arXiv. |
2023 | 이미지 | 중간 | Stable Diffusion 2 | Stable Diffusion, DALL-E2 | membership inference | Noise injection, prompt filtering | Latent Diffusion | 중 | 높음 | Rombach & Stability AI (2023). Stable Diffusion 2. arXiv. |
2023 | 텍스트 | 높음 | BLOOM | GPT-J, GPT-NeoX | multilingual leakage | DP-SGD, alignment | Transformer LM | 매우 높음 | 높음 | BigScience (2023). BLOOM. ACL. |
🔹 참고문헌 (2021~2023, 15편)
- Brown, T. B., et al. (2021). Language models are few-shot learners (GPT-3). In NeurIPS.
- Esser, P., et al. (2021). Taming transformers for high-resolution image synthesis (VQGAN-CLIP). In CVPR.
- Zhang, Y., et al. (2021). Ensuring differential privacy in GAN-based EHR synthesis. Journal of Biomedical Informatics.
- Gulati, A., et al. (2021). Conformer: Convolution-augmented Transformer for speech recognition. In Interspeech.
- Chen, M., et al. (2021). Evaluating large language models trained on code (Codex). arXiv:2107.03374.
- Saharia, C., et al. (2022). Imagen: Photorealistic text-to-image diffusion models. In CVPR.
- Ramesh, A., et al. (2022). Hierarchical text-conditional image generation (DALL·E 2). arXiv:2204.06125.
- Rombach, R., Blattmann, A., et al. (2022). High-resolution image synthesis with Latent Diffusion Models. In CVPR.
- Black, S., et al. (2022). GPT-J and GPT-NeoX technical report. arXiv:2204.06745.
- Yu, J., et al. (2022). Scaling autoregressive image models (Parti). arXiv:2206.12356.
- Touvron, H., et al. (2022). LLaMA: Open and efficient foundation language models. arXiv:2302.13971.
- OpenAI. (2023). ChatGPT: Optimizing language models with human feedback. OpenAI Technical Report.
- OpenAI. (2023). GPT-4 Technical Report. arXiv:2303.08774.
- Rombach, R., & Stability AI. (2023). Stable Diffusion 2. arXiv preprint.
- BigScience Workshop. (2023). BLOOM: A 176B-parameter open-access multilingual LLM. In ACL 2023.
반응형
'지식창고' 카테고리의 다른 글
생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2025 보충 (3) | 2025.08.20 |
---|---|
생성AI 알고리즘과 프라이버시 보호를 연구 - 2024~2025년 (0) | 2025.08.20 |
생성AI 알고리즘과 프라이버시 보호를 연구 - 2018~2020년 (0) | 2025.08.20 |
생성AI 알고리즘과 프라이버시 보호를 연구 - 2015~2017년 (0) | 2025.08.20 |
생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2014 (0) | 2025.08.20 |