지식창고

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

오이시이 2025. 8. 20. 00:36

ㅁ 생성AI 알고리즘과 프라이버시 보호를 연구집

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

연도별 주요 연구 동향 요약

2010년대 초반: Differential Privacy (차등 프라이버시)와 머신러닝 결합 연구 시작.
2014~2017년: GAN(Generative Adversarial Network) 등장, 이미지/텍스트 생성과 프라이버시 유출 취약점 분석 논문 증가.
2018~2020년: DeepFake, Text-to-Speech와 같은 실제 활용 관련 프라이버시 위협 연구.
2021~2025년: Diffusion Models, ChatGPT, LLaMA 계열 대규모 언어 모델(LLMs)에서 데이터 투명성, 개인정보 학습 문제, 데이터 탈식별화 연구 증가.

이 시기는 대규모 언어모델(LLM, GPT-3/4, LLaMA 등)과 Diffusion Models(Stable Diffusion, DALL·E 2 등)이 등장하며 데이터 프라이버시 유출이 큰 논의가 된 시기입니다.
또한, 멤버십 추론, 데이터 추출 공격(model extraction), Prompt Injection에 대응하기 위한 방어 기법(DP-SGD, noise, fine-tuning with regularization)들이 제시되었습니다.

🔹 4차 정리 (2021~2023년, 총 15편)


발행년도	생성 데이터 유형	프라이버시 수준	생성모델명	비교 검토 모델	모델의 취약점	개선 방어 기술	구현 기술	난이도	성능수준	연구 논문명 (APA)
2021	텍스트	높음	GPT-3	BERT, T5	훈련 데이터 유출 (text memorization)	Differential Privacy, Data Filtering	Transformer, DP	매우 높음	매우 높음	Brown et al. (2021). GPT-3. NeurIPS.
2021	이미지	중간	VQGAN + CLIP	GAN, VAE	이미지 유사 데이터 복원	Embedding Noise	GAN, VAE, Transformer	높음	높음	Esser et al. (2021). VQGAN-CLIP. CVPR.
2021	의료 데이터	높음	DP-GAN (EHR)	medGAN	환자 데이터 재식별	Differential Privacy Noise	GAN, DP, NN	높음	중	Zhang et al. (2021). DP-GAN Healthcare. JBI.
2021	음성	중간	Conformer TTS	WaveNet	화자 유출	Voice Conversion Privacy Masking	RNN, Transformer	높음	높음	Gulati et al. (2021). Conformer. Interspeech.
2021	코드 데이터	높음	Codex	GPT-3	private repo memorization	Filtering, DP regularization	LLM (Transformer)	매우 높음	매우 높음	Chen et al. (2021). Codex. arXiv.
2022	이미지	중간	Imagen	DALL-E, VQGAN	학습데이터 memory leak	Prompt Perturbation	Diffusion, Transformer	매우 높음	매우 높음	Saharia et al. (2022). Imagen. CVPR.
2022	이미지	높음	DALL·E 2	CLIP, VQGAN	프롬프트 기반 원본 데이터 복원	Output Filtering	Diffusion, Transformer	매우 높음	매우 높음	Ramesh et al. (2022). DALL·E 2. arXiv.
2022	이미지	높음	Stable Diffusion	GAN, VAE	훈련 이미지 inversion	Latent Perturbation, Noise Injection	Latent Diffusion	중	높음	Rombach et al. (2022). Latent Diffusion Models. CVPR.
2022	텍스트	높음	GPT-J, GPT-NeoX	GPT-2, GPT-3	데이터 memorization	DP fine-tune, blacklist filtering	Transformer	높음	높음	Black et al. (2022). GPT-J. arXiv.
2022	이미지+텍스트	높음	Parti	Imagen	dataset leakage	Secure training pipelines	Diffusion, Transformer	매우 높음	매우 높음	Yu et al. (2022). Parti. arXiv.
2022	텍스트	높음	LLaMA	GPT-3	학습데이터 포함 개인정보 유출	Content Moderation, DP	Transformer	매우 높음	매우 높음	Touvron et al. (2022). LLaMA. arXiv.
2023	텍스트	높음	ChatGPT	GPT-3.5	개인데이터 질문에 노출	RLHF, Safety filtering	Transformer, RLHF	매우 높음	매우 높음	OpenAI (2023). ChatGPT. OpenAI Blog/Tech Report.
2023	멀티모달	높음	GPT-4	GPT-3, DALL-E2	데이터 추출	Fine-tuning with DP	Transformer, Multimodal	매우 높음	매우 높음	OpenAI (2023). GPT-4 Technical Report. arXiv.
2023	이미지	중간	Stable Diffusion 2	Stable Diffusion, DALL-E2	membership inference	Noise injection, prompt filtering	Latent Diffusion	중	높음	Rombach & Stability AI (2023). Stable Diffusion 2. arXiv.
2023	텍스트	높음	BLOOM	GPT-J, GPT-NeoX	multilingual leakage	DP-SGD, alignment	Transformer LM	매우 높음	높음	BigScience (2023). BLOOM. ACL.

🔹 참고문헌 (2021~2023, 15편)

Brown, T. B., et al. (2021). Language models are few-shot learners (GPT-3). In NeurIPS.
Esser, P., et al. (2021). Taming transformers for high-resolution image synthesis (VQGAN-CLIP). In CVPR.
Zhang, Y., et al. (2021). Ensuring differential privacy in GAN-based EHR synthesis. Journal of Biomedical Informatics.
Gulati, A., et al. (2021). Conformer: Convolution-augmented Transformer for speech recognition. In Interspeech.
Chen, M., et al. (2021). Evaluating large language models trained on code (Codex). arXiv:2107.03374.
Saharia, C., et al. (2022). Imagen: Photorealistic text-to-image diffusion models. In CVPR.
Ramesh, A., et al. (2022). Hierarchical text-conditional image generation (DALL·E 2). arXiv:2204.06125.
Rombach, R., Blattmann, A., et al. (2022). High-resolution image synthesis with Latent Diffusion Models. In CVPR.
Black, S., et al. (2022). GPT-J and GPT-NeoX technical report. arXiv:2204.06745.
Yu, J., et al. (2022). Scaling autoregressive image models (Parti). arXiv:2206.12356.
Touvron, H., et al. (2022). LLaMA: Open and efficient foundation language models. arXiv:2302.13971.
OpenAI. (2023). ChatGPT: Optimizing language models with human feedback. OpenAI Technical Report.
OpenAI. (2023). GPT-4 Technical Report. arXiv:2303.08774.
Rombach, R., & Stability AI. (2023). Stable Diffusion 2. arXiv preprint.
BigScience Workshop. (2023). BLOOM: A 176B-parameter open-access multilingual LLM. In ACL 2023.

저작자표시 변경금지 (새창열림)

'지식창고' 카테고리의 다른 글

생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2025 보충 (3)	2025.08.20
생성AI 알고리즘과 프라이버시 보호를 연구 - 2024~2025년 (0)	2025.08.20
생성AI 알고리즘과 프라이버시 보호를 연구 - 2018~2020년 (0)	2025.08.20
생성AI 알고리즘과 프라이버시 보호를 연구 - 2015~2017년 (0)	2025.08.20
생성AI 알고리즘과 프라이버시 보호를 연구 - 2010~2014 (0)	2025.08.20

현재글생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

도깨비방

엔터테인먼트, 금융, 게임, 생활의 지혜 상품 추천 등

privacy preserving의 개념, 생성AI 알고리즘과 프라이버시 보호, 합성데이터, 신용데이터학습, LLM 정보보호, 프라이버시 평가 프레임워크, 정보보호 AI, 서비스엔지니어링, AGAI, 프라이버시 보호 모델, privacy preserving, 2019인기가요, 경영, 금융 분야의 합성 데이터 응용, 경영전략, 개인정보 보호, 비식별.익명성 평가 - k-익명성, 프라이버시 보호 체계, 포켓몬친구, 포켓몬고친구,

Today :
Yesterday :

도깨비방

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

연도별 주요 연구 동향 요약

🔹 4차 정리 (2021~2023년, 총 15편)

🔹 참고문헌 (2021~2023, 15편)

'지식창고' 카테고리의 다른 글

'지식창고'의 다른글

티스토리툴바

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

생성AI 알고리즘과 프라이버시 보호를 연구 - 2021~2023년

연도별 주요 연구 동향 요약

🔹 4차 정리 (2021~2023년, 총 15편)

🔹 참고문헌 (2021~2023, 15편)

'지식창고' 카테고리의 다른 글

'지식창고'의 다른글

관련글

티스토리툴바