본문 바로가기

제일 브레이크 아스키아트1

AI 채팅봇이 생성할 수 없는 대답을 '아스키 아트'로 대답시킬 수 있다는 보고 GPT-4, Gemini, Claude, Lama 2 등의 대규모 언어 모델은 입력한 내용에 따라 인간과 동등한 정밀도로 자연스러운 문장을 출력합니다. 그러나 폭력적인 내용이나 불법적인 내용 등에 대해서는 개발 시점에서 출력하지 않도록 대책을 마련하고 있습니다. 이 안전 대책을 회피하는 「탈옥(제일 브레이크)」을 아스키 아트로 실행하는 방법 「ArtPrompt」에 관한 논문이 공개되고 있습니다. [2402.11753] ArtPrompt : ASCII Art-based Jailbreak Attacks against Aligned LLMs https://arxiv.org/abs/2402.11753 ArtPrompt: ASCII Art-based Jailbreak Attacks against Aligned L.. 2024. 3. 13.

이전 1 다음

티스토리툴바