본문 바로가기
AI · 인공지능/AI 뉴스

과학논문의 '부정하게 조작된 이미지'를 검출하는 AI 툴은 이미 인간을 웃돈다는 연구 결과

by 두우우부 2023. 10. 6.
반응형

 
 
과학논문에서 이미지나 데이터를 부정하게 조작하여 결과를 변조하는 행위는 과학전반에 대한 신뢰를 뒤흔드는 심각한 문제이며, 논문의 부정을 검출하는 대처는 매우 중요합니다. 그런 과학논문의 부정하게 조작된 이미지를 검출하기 위한 AI 툴은, 이미 인간의 육안에 의한 체크보다 높은 정밀도를 가지고 있다는 연구 결과가, 프리프린트 서버의 bioRxiv에 게재된 사전 검토 논문에서 보고되었습니다.

A Quantitative Study of Inappropriate Image Duplication in the Journal Toxicology Reports | bioRxiv
https://www.biorxiv.org/content/10.1101/2023.09.03.556099v2

A Quantitative Study of Inappropriate Image Duplication in the Journal Toxicology Reports

Inappropriate image duplication is a type of scientific error that can be detected by examining published literature. Few estimates of the frequency of this problem have been published. This study aimed to quantify the rate of image duplication in the jour

www.biorxiv.org



최근에는 과학 논문의 부정이 큰 문제가 되어 2022년 11월에는 스탠퍼드 대학의 마크 테시에라빈 학장(당시)이 주 집필자를 맡은 여러 논문에서 데이터 조작 등의 부정이 있었을 가능성이 있다고 보도되었습니다. 테시에라빈은 신경과학자이며, 의심스러운 논문에는 알츠하이머병에 대한 매우 영향력 있는 논문도 포함되어 있었습니다.

덧붙여 테시에라빈 개인이 직접 부정행위에 관여하거나 공동연구자의 부정행위를 인식하거나 하고 있던 증거는 없었다고 합니다만, 테시에라빈은 인책 사임이라고 하는 형태로 2023년 8월에 학장직을 물러났습니다.

이와 같이, 부정이 행해진 과학논문이 통과되는 케이스는 결코 드물지 않습니다. 미국 미생물학자인 엘리자베스 빅은 2016년 연구에서 2만 621건의 논문을 스크리닝 한 결과 782건의 논문에서 '부적절한 이미지 중복'이 있었다고 보고했습니다. 782건 중 3분의 1은 단순한 이미지 붙여 넣기의 실수 가능성이 있지만, 절반은 분명히 가공된 것이었다고 합니다.

이러한 과학논문의 부정은 과학연구 전반에 대한 신뢰성을 뒤흔들기 때문에, 논문의 부정행위를 간파하는 시도가 중요성을 얻고 있습니다. 그래서 과학 논문의 부정한 이미지 조작에 대해 조사하고 있는 생물학자 숄트 데이비드 씨는 논문의 이미지 조작을 검출하는 AI 툴 "Imagetwin"의 정밀도를 확인하는 테스트를 실시했습니다.

https://imagetwin.ai/

Home - Imagetwin

ImageTwin is an AI-based software to automatically detect image integrity issues in figures of life science articles.

imagetwin.ai



우선 데이비드 씨는 독물학의 학술지인 Toxicology Reports에 2014년~2023년에 걸쳐 게재된 관련 이미지를 포함한 715건의 논문에 대해 자신의 눈으로 조사하여 이미지 조작이 이루어졌을 가능성 있는 논문을 확인했습니다. 그 후 Imagetwin을 사용하여 같은 논문군을 분석하여 자신의 조사 결과와 어떤 차이가 있는지 조사했다는 것. 

그 결과 Imagetwin은 데이비드 씨보다 2~3배의 속도로 조사를 실시했을 뿐만 아니라, 데이비드 씨가 마킹한 63건의 논문 대부분 및 간과한 논문 41건을 발견할 수 있었음이 확인되었습니다. 데이비드 씨의 논문은 아직 검토를 받지 않았지만, Toxicology Reports를 출판하는 학술계 출판사인 엘제비어의 홍보 담당자는 "우리는 이 사전 검토 논문을 인식하고 있으며 사내 조사를 시작했다"라고 댓글을 달았습니다.



Imagetwin은 오스트리아의 비엔나에 거점을 둔 기업 ImageTwin AI에 의해 개발된 AI 툴이며, 약 200개의 대학이나 출판사, 과학 단체 등이 사용하고 있다는 것.

개발자에 따르면 Imagetwin은 논문에 포함되어 있는 모든 이미지에 대해 "이미지의 지문"이라고도 할 수 있는 것을 작성해, 이 지문이 중복되는 이미지를 논문 전체로 찾는 것으로 부정 조작을 검출한다고 합니다. 또한, 다른 논문에 게재된 약 2500만 장의 이미지로 이루어진 데이터베이스와 대조해, 과거의 논문으로부터 도용된 이미지가 없는지도 체크하는 구조입니다. 이러한 프로세스를 실행하는 데 걸리는 시간은 불과 5~10초 정도로 인간보다 빠르고 방대한 데이터를 스캔할 수 있습니다.

유럽 생화학 협회 연맹 (FEBS)의 출판 플랫폼 FEBS Press의 이미지 무결성 분석가 야나 크리스토퍼는 Imagetwin 등의 AI툴에는 장점과 단점이 있다고 지적하고, 인간의 눈과 AI 도구를 결합한 이미지 조작 검사를 논문 검토 프로세스에 통합해야 한다고 주장했습니다.

반응형