Google의 연구팀은 AI의 힘을 활용하여 파일 형식을 빠르고 효율적으로 식별하는 툴「Magika」를 개발하여 오픈 소스로 공개했습니다. Magika는 99% 이상의 정밀도로 바이너리나 텍스트의 파일 타입을 검출해, CPU상에서도 밀리 세컨드 이내에 실행할 수 있다고 합니다.
Magika: AI powered fast and efficient file type identification | Google Open Source Blog
https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html
Magika
https://google.github.io/magika/
Google launches AI Cyber Defense Initiative to improve security infrastructure
https://blog.google/technology/safety-security/google-ai-cyber-defense-initiative/
사이버 보안의 큰 과제가 되고 있는 것이, 「공격자는 단 하나의 취약성을 찾아 공격하면 되지만, 방어 측은 디지털 영역 전체에서 항상 최선의 방어책을 계속 전개해야 한다는 점입니다. 사이버 공간은 공격자에게 유리한 상황으로, 방어 측은 대부분의 경우 이미 존재하는 위협을 줄이는 것 밖에는 할 수 없다는 것.
Google Cloud의 최고 정보 보안 책임자인 필 베너블스 씨는 이 '방어 측의 딜레마'라는 상황을 AI의 힘으로 역전시킬 수 있다고 주장합니다. 베너블스 씨는 "AI는 위협 탐지, 악성코드 분석, 취약성 탐지 및 수정, 사고 대응에 보안 전문가 및 방어 담당자의 작업을 확장할 수 있게 한다."라고 말했습니다.
그래서 Google의 연구팀은 새롭게 AI를 이용하여 파일 형식을 빠르고 효율적으로 식별하는 툴 'Magika'를 개발하여 오픈 소스로 공개했습니다.
GitHub - google/magika: Detect file content types with deep learning
https://github.com/google/magika/tree/main
악의적인 공격자는 악성코드나 악성코드를 포함한 파일을 정상적인 파일로 위장하여 메일에 첨부하여 보내거나 다운로드하도록 합니다. 위험한 파일을 통한 공격을 막는 첫 번째 단계로 파일 형식을 정확하게 식별해야 합니다.
지금까지 컴퓨터가 파일 형식을 식별하는 많은 소프트웨어는 사람의 손에 의한 휴리스틱 한 사용자 정의 규칙에 의존해 왔습니다. 그러나 수동 접근법은 시간이 걸리는 데 오류가 발생하기 쉽고, 악의적인 공격자의 대책에 대해 그리 신뢰성이 높지 않다는 것.
반면 Magika는 고도로 최적화된 맞춤형 딥 러닝 모델을 사용하여 매우 높은 정확도로 파일 형식을 식별할 수 있는 도구입니다. 또한 모델 크기가 1MB로 줄어들기 때문에 CPU에서도 밀리초 단위로 파일을 식별할 수 있다고 연구팀은 설명합니다.
아래 그래프는 ExifTool이나 File magik 등의 툴과 Magika의 정밀도를 비교한 벤치마크 결과를 나타낸 것이다. Magika의 성능은 다른 도구를 능가한다는 것을 알 수 있습니다.
또한 Magika에서 식별 가능한 파일 형식과 그 정밀도는 공식 페이지에서 확인할 수 있습니다. 연구팀에 따르면 Magika는 대부분의 파일 형식에서 99% 이상의 정확도를 자랑한다고 합니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
NVIDIA의 CEO가 "AI 때문에 더 이상 프로그래밍을 배울 필요가 없다"고 말하여 논쟁 (77) | 2024.02.28 |
---|---|
음성·텍스트·이미지·음악의 입출력에 대응한 멀티 모달 LLM「AnyGPT」가 등장 (86) | 2024.02.23 |
OpenAI 지원 로봇 기업「1X」의 안드로이드가 세련된 동작으로 작업하는 영상 (82) | 2024.02.21 |
기계 학습 모델의 재학습으로 LoRA보다 적은 비용과 시간으로 더 높은 성능을 기대할 수 있는「DoRA」 (80) | 2024.02.21 |
동영상을 보고 학습하는 아키텍처 「V-JEPA」를 Meta가 개발 (76) | 2024.02.20 |
중국에서 잇따라 AI 모델이 승인되고, 93조 규모의 AI 산업 시장으로 (111) | 2024.01.31 |
Meta가 코드 생성 AI 모델의 새로운 버전 「Code Llama 70B」를 릴리스, 코드 정확성이 향상 (110) | 2024.01.31 |
구글 챗봇 AI 「Bard」가 드디어 벤치마크 스코어에서 GPT-4를 넘어 2위로 부상 (91) | 2024.01.30 |