ChatGPT 등 채팅 AI의 보안 기능을 파괴하는 멀웨어 「Morris II」가 등장

OpenAI의 ChatGPT나 Google의 Gemini 같은 채팅 AI를 조작할 수 있는 Worm 「Morris II」를 통하여 사용자의 개인정보를 훔치는 데 성공한 연구원이 등장했습니다.

ComPromptMized
https://sites.google.com/view/compromptmized

ComPromptMized

Stav Cohen Technion - Israel Institute of Technology

sites.google.com

New Malware Worm Can Poison ChatGPT, Gemini-Powered Assistants | PCMag
https://www.pcmag.com/news/malware-worm-poison-chatgpt-gemini-powered-assistants

Morris II는 생성 AI를 활용하는 애플리케이션을 타깃으로 한 제로 클릭 웜으로, 이스라엘 공과 대학과 코넬 공과 대학, 소프트웨어 개발 기업 Intuit 등의 연구원들에 의해 개발되었습니다. 덧붙여,「Morris II」 이름의 유래는 초기 인터넷으로 확산된 웜 「Morris」로부터 유래하고 있습니다.

Morris II는 사용자가 어떠한 조작 없이도 공격 대상이 되는 단말에 감염시킬 수 있어 감염 단말로부터 다른 단말로 확산되면서 단말로부터 데이터를 훔치거나 단말에 악성코드를 감염시켜 수 있습니다. 연구팀은 Morris II를 사용하여 ChatGPT와 Gemini, 오픈 소스 AI 모델인 LLaVA 등에 대한 공격을 성공적으로 수행했다고 발표했습니다.

연구팀은 Morris II의 개발 경위를 이렇게 밝혔습니다.

과거 1년간 생성 AI 기능을 앱에 통합한 반자율형 또는 완전 자율형 에이전트로 구성된 상호 연결형 생성 AI 생태계가 다수 등장했습니다. 기존 연구는 에이전트 생성 AI 계층에 대한 위험(다이얼로그 포이즈닝, 개인 정보 보호 누출, 탈옥 등)을 강조하고 있지만, 공격자는 에이전트 생성 AI 구성 요소를 악용하여 생성 AI 전체에 대해 사이버 공격을 가하는 악성코드를 개발할 수 있을까 하는 의문이 들었습니다.

생성 AI 시스템의 대부분은 프롬프트를 입력하여 작동하지만, 이 프롬프트에 적용된 규칙(유해한 콘텐츠 생성을 차단하는 등)을 Morris II 로 파괴할 수 있습니다.

연구팀은 "공격자가 입력에 프롬프트를 삽입하고 생성 AI 모델에 의해 처리될 때 모델에 입력을 출력으로 복제하고 악의적인 활동(페이로드)을 수행하도록 모델에 촉구할 가능성이 있음을 보여줍니다. Morris II 와 같은 AI 웜은 현재까지는 발견되지 않았지만, 여러 연구자들이 "스타트업, 개발자, 기술 기업이 우려해야 할 보안 위험"이라고 지적했습니다.

연구팀은 Morris II 에서 "적대적 자기 복제 프롬프트"를 채용하고 있다고 설명하고 있으며, 이것은 "생성 AI 모델이 응답으로 다른 프롬프트를 출력하도록 트리거하는 프롬프트"라는 것입니다. 즉, AI 시스템은 응답에서 일련의 추가 명령을 생성하도록 지시받을 것입니다. 따라서 연구팀은 "적대적 자기 복제 프롬프트"에 대해 "전통적인 SQL 주입 공격 및 버퍼 오버플로우 공격과 거의 유사하다."라고 설명했습니다.

또한 Morris II 의 개념 실증용 코드가 GitHub에 공개되어 있습니다.

GitHub - StavC/ComPromptMized: ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications
https://github.com/StavC/ComPromptMized

GitHub - StavC/ComPromptMized: ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications

ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications - StavC/ComPromptMized

github.com

저작자표시 비영리 변경금지

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

AI 조종으로 각광받는「프롬프트 엔지니어」가 벌써 사라질 위기? (65)	2024.03.11
Midjourney, ChatGPT Plus, DreamStudio, Image Creator는 41%의 비율로 가짜 선거이미지를 생성 (73)	2024.03.08
GPT-4를 뛰어넘는 성능으로 이미지와 문장을 동시에 처리할 수 있는 멀티모달 AI「Claude 3」출시 (71)	2024.03.06
AI에게「스타 트렉의 선장이 되어라」라고 지시하면 더 나은 성능을 발휘하는 것을 발견 (77)	2024.03.05
Microsoft가 1.58비트 LLM을 출시, 행렬 계산을 더하여 계산 비용을 급감 (72)	2024.03.04
LLM의 동작을 Excel에서 완벽 재현하여 AI 구조를 학습하는 시트가 등장 (71)	2024.03.04
AI가 이미지 설명을 자동으로 생성 (89)	2024.02.29
Microsoft가 생성 AI의 허점을 테스트하는 툴「PyRIT」을 발표 (82)	2024.02.28

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

두우우부

ChatGPT 등 채팅 AI의 보안 기능을 파괴하는 멀웨어 「Morris II」가 등장

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

ChatGPT 등 채팅 AI의 보안 기능을 파괴하는 멀웨어 「Morris II」가 등장

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역