Google이 AI로 파일 형식을 식별하는 도구 「Magika」를 오픈 소스로 공개

Google의 연구팀은 AI의 힘을 활용하여 파일 형식을 빠르고 효율적으로 식별하는 툴「Magika」를 개발하여 오픈 소스로 공개했습니다. Magika는 99% 이상의 정밀도로 바이너리나 텍스트의 파일 타입을 검출해, CPU상에서도 밀리 세컨드 이내에 실행할 수 있다고 합니다.

Magika: AI powered fast and efficient file type identification | Google Open Source Blog
https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

Magika
https://google.github.io/magika/

Google launches AI Cyber Defense Initiative to improve security infrastructure
https://blog.google/technology/safety-security/google-ai-cyber-defense-initiative/

사이버 보안의 큰 과제가 되고 있는 것이, 「공격자는 단 하나의 취약성을 찾아 공격하면 되지만, 방어 측은 디지털 영역 전체에서 항상 최선의 방어책을 계속 전개해야 한다는 점입니다. 사이버 공간은 공격자에게 유리한 상황으로, 방어 측은 대부분의 경우 이미 존재하는 위협을 줄이는 것 밖에는 할 수 없다는 것.

Google Cloud의 최고 정보 보안 책임자인 필 베너블스 씨는 이 '방어 측의 딜레마'라는 상황을 AI의 힘으로 역전시킬 수 있다고 주장합니다. 베너블스 씨는 "AI는 위협 탐지, 악성코드 분석, 취약성 탐지 및 수정, 사고 대응에 보안 전문가 및 방어 담당자의 작업을 확장할 수 있게 한다."라고 말했습니다.

그래서 Google의 연구팀은 새롭게 AI를 이용하여 파일 형식을 빠르고 효율적으로 식별하는 툴 'Magika'를 개발하여 오픈 소스로 공개했습니다.

GitHub - google/magika: Detect file content types with deep learning
https://github.com/google/magika/tree/main

악의적인 공격자는 악성코드나 악성코드를 포함한 파일을 정상적인 파일로 위장하여 메일에 첨부하여 보내거나 다운로드하도록 합니다. 위험한 파일을 통한 공격을 막는 첫 번째 단계로 파일 형식을 정확하게 식별해야 합니다.

지금까지 컴퓨터가 파일 형식을 식별하는 많은 소프트웨어는 사람의 손에 의한 휴리스틱 한 사용자 정의 규칙에 의존해 왔습니다. 그러나 수동 접근법은 시간이 걸리는 데 오류가 발생하기 쉽고, 악의적인 공격자의 대책에 대해 그리 신뢰성이 높지 않다는 것.

반면 Magika는 고도로 최적화된 맞춤형 딥 러닝 모델을 사용하여 매우 높은 정확도로 파일 형식을 식별할 수 있는 도구입니다. 또한 모델 크기가 1MB로 줄어들기 때문에 CPU에서도 밀리초 단위로 파일을 식별할 수 있다고 연구팀은 설명합니다.

아래 그래프는 ExifTool이나 File magik 등의 툴과 Magika의 정밀도를 비교한 벤치마크 결과를 나타낸 것이다. Magika의 성능은 다른 도구를 능가한다는 것을 알 수 있습니다.

또한 Magika에서 식별 가능한 파일 형식과 그 정밀도는 공식 페이지에서 확인할 수 있습니다. 연구팀에 따르면 Magika는 대부분의 파일 형식에서 99% 이상의 정확도를 자랑한다고 합니다.

저작자표시 비영리 변경금지

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

NVIDIA의 CEO가 "AI 때문에 더 이상 프로그래밍을 배울 필요가 없다"고 말하여 논쟁 (77)	2024.02.28
음성·텍스트·이미지·음악의 입출력에 대응한 멀티 모달 LLM「AnyGPT」가 등장 (86)	2024.02.23
OpenAI 지원 로봇 기업「1X」의 안드로이드가 세련된 동작으로 작업하는 영상 (82)	2024.02.21
기계 학습 모델의 재학습으로 LoRA보다 적은 비용과 시간으로 더 높은 성능을 기대할 수 있는「DoRA」 (80)	2024.02.21
동영상을 보고 학습하는 아키텍처 「V-JEPA」를 Meta가 개발 (76)	2024.02.20
중국에서 잇따라 AI 모델이 승인되고, 93조 규모의 AI 산업 시장으로 (111)	2024.01.31
Meta가 코드 생성 AI 모델의 새로운 버전 「Code Llama 70B」를 릴리스, 코드 정확성이 향상 (110)	2024.01.31
구글 챗봇 AI 「Bard」가 드디어 벤치마크 스코어에서 GPT-4를 넘어 2위로 부상 (91)	2024.01.30

두우우부

Google이 AI로 파일 형식을 식별하는 도구 「Magika」를 오픈 소스로 공개

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

Google이 AI로 파일 형식을 식별하는 도구 「Magika」를 오픈 소스로 공개

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바