Meta가 2023년 8월 31일에 영상 처리 모델 "DINOv2"의 라이센스를 CC BY-NC 4.0에서 Apache License 2.0으로 변경한다고 발표했습니다. 상용 이용에 관한 제한이 사라져, 보다 자유롭게 모델을 이용하는 것이 가능해졌습니다. 동시에 모델의 공정성을 평가하기 위한 데이터 세트 「FACET」도 출시되었습니다.
Announcing the commercial relicensing and expansion of DINOv2, plus the introduction of FACET
DINOV2는 지도학습으로 훈련된 모델이며 이미지를 물체별로 세분화하는 "시맨틱 이미지 세그멘테이션"이나 깊이를 추정하는 "단안 심도 추정" 등 다양한 영상 관련 태스크를 파인 튜닝 없이 해내는 것이 특징입니다. 아래의 영상을 보시면 알 수 있듯이 강아지가 달리고 있는 영상에서 '머리', '몸통', '다리' 등을 깔끔하게 세그멘테이션 분리하는 능력을 가지고 있습니다.
그 외, DINOv2에 대한 자세한 정보는 아래를 참고하세요.
2023년 4월의 DINOv2 발표 당시에는 CC BY-NC 4.0 라이센스로의 제공되어, 상용 이용이 불가했지만, 2023년 8월 31일부터는 오픈 소스 라이센스인 Apache License 2.0 으로 제공되어, 상용 · 비상용을 불문하고 자유롭게 이용이 가능해졌습니다. 동시에 DINOv2를 이용하여 '시맨틱 이미지 세그멘테이션' 및 '단안 심도 추정'을 수행하는 코드도 공개되었습니다.
또한 Meta는 AI가 공정하고 공평하다는 것을 보장하기 위해, 분류 · 탐지 · 세분화 및 이미지 검색 작업에서 컴퓨터 비전 모델의 공정성을 평가하기 위한 새로운 포괄적 벤치 마크로서 「FACET」 데이터 세트를 출시했습니다.
「FACET」는 5만 명을 포함한 3만 2,000장의 이미지로 구성되어 있으며, 인간의 주석에 의해 연령과 성별, 피부색, 헤어스타일, 직업 등의 라벨이 붙여져 있습니다.
FACET를 이용하면, 「스케이트 보더라고 인식되는 비율은 남녀 간에 얼마나 다른가」라든지, 「피부색에 의해 인식율이 얼마나 달라지는가」 등에 대하여 모델을 테스트하는 것이 가능합니다.
「DINOv2」,「OpenCLIP」,「SEERv2」라는 3개의 모델로 테스트한 결과는 아래와 같습니다. 그림의 왼쪽에는 모델 이름, 아키텍처 및 교육에 사용한 데이터 세트가 나열되어 있으며, 오른쪽에는 테스트 결과가 표시됩니다. 양극단 그룹의 인식률 차이를 스코어로 사용하기 때문에 값이 낮은 쪽이 보다 공정하고 공평한 모델입니다. 남녀 간의 차이에 대해서는 OpenCLIP에 미치지 못했지만, 연령이나 피부색에 관해서는 DINOv2가 가장 뛰어난 퍼포먼스를 발휘했습니다.
또한 FACET 데이터 세트에 대해서는 연구 용도에만 한정하여 배포되고 있으며, 다운로드하려면 Meta에 따로 신청하여 허가를 받아야 합니다.
https://ai.meta.com/datasets/facet-downloads/
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
ChatGPT가 레시피를 작성하고 Midjourney로 라벨 디자인한「AI맥주」 (0) | 2023.09.05 |
---|---|
Google Docs에 AI가 문장을 수정하는「Proofread」기능을 정식 도입 (0) | 2023.09.05 |
Google이 AI를 공격하는 6가지 방법을 공개, 개인정보 추출부터 AI를 훔치는 방법까지 (0) | 2023.09.05 |
수학에 강한 AI 「WizardMath」가 등장, Meta의 'Llama-2'를 강화 (0) | 2023.09.04 |
AI의 인기로 「.ai」도메인을 가진 카리브해의 작은 섬 「앵귈라」가 연간 수백억을 벌고 있다 (0) | 2023.09.01 |
Microsoft가 AI를 공격하는 전문 조직 'AI 레드팀'의 노하우 공개, 타사에도 설립 호소 (0) | 2023.09.01 |
Naver가 독자적인 대규모 언어 모델 「Hyper CLOVA X」를 발표 (1) | 2023.09.01 |
AI가 드론 레이스에서 세계 챔피언(사람)에게 승리 (1) | 2023.09.01 |