본문 바로가기
트렌드 이슈 · 토픽

해적판 검색엔진 「Anna's Archive」가 세계 최대의 도서관 카탈로그로부터 데이터를 취득, 세계 모든 책의 보존을 목표로

by 두우우부 2023. 10. 11.
반응형

 
 
세계 최대급 전자서적 데이터베이스 'Z-Library'가 운영자 체포 및 기소 등 일련의 법적 조치를 받은 데 맞서 비영리의 온라인 섀도 라이브러리 메타서치 엔진으로 만들어진 것이 Anna's Archive입니다. Anna's Archive가 만들어진 당초에는 "전 세계 서적의 약 5%를 보존하고 있다"라고 명명되었습니다. 카탈로그인 WorldCat에서 정보를 추출하고 있는 것이 밝혀졌습니다.

1.3B Worldcat scrape & data science mini-competition - Anna's Blog

Anna’s Archive Containers (AAC): standardizing releases from the world’s largest shadow library

Anna’s Archive has become the largest shadow library in the world, requiring us to standardize our releases.

annas-blog.org


Anna's Archive Scraped WorldCat to Help Preserve 'All' Books in the World * TorrentFreak

Anna's Archive Scraped WorldCat to Help Preserve 'All' Books in the World * TorrentFreak

Home > Piracy > Anna's Archive scraped WorldCat, the world's largest library catalog, in an effort to help preserve digital copies of every book in the world. The meta search engine is well aware of the legal risks but believes that these are well worth ta

torrentfreak.com



인터넷 최대의 해적판 전자책 데이터베이스 중 하나인 Z-Library는 1천만 권 이상의 전자책과 8,600만 건이 넘는 학술 기사를 제공하고 있으며, 매달 수백만 명의 액세스가 있었습니다. 2022년 11월 4일에 갑자기 폐쇄한 것 외에, 약 2주 후인 11월 16일에는 Z-Library를 운영하고 있던 2명의 러시아인의 체포 및 기소가 발표되었습니다. 덧붙여 Z-Library는 몇 개월 후에 부활되었습니다.

해적판 무료 책(도서) 다운로드 검색엔진 「Anna's Archive」란?

세계 최대급의 전자 서적 데이터베이스로 '세계 최대의 도서관'을 자칭하는 해적판 사이트 'Z-Library'는 2022년 11월에 갑자기 폐쇄되고 운영자가 체포·기소되어 존속이 위험해졌습니다. Z-Library에

doooob.tistory.com



Z-Library는 급등하는 교과서를 입수할 수 없는 학생 등 매월 수백만 명의 사용자가 의지하고 있으며, 갑자기 폐쇄했을 때에는 "알렉산드리아 도서관의 방화가 현대에 일어난 것 같다"는 등 한탄의 소리가 나왔습니다. Z-Library에 대한 법적 조치에 대항하여 만들어진 것이 Anna's Archive로, "책, 논문, 만화, 잡지 및 기타 문서를 검색하기 위한 핵심 장소가 필요하다고 느꼈기 때문에 만들었습니다. 우리는 정보의 자유로운 흐름과 지식과 문화의 보존을 강력하게 믿습니다."라고 그 목적을 선언했습니다.

Anna's Archive는 저작권으로 보호되는 콘텐츠를 직접 다루지 않도록 위험을 피하고 있지만, 법적 위험도 잘 숙지하고 있다고 말합니다. 게다가 "인류의 문자에 의한 유산을 보존하기 위해서는 이러한 리스크를 취할 가치가 있다고 믿습니다."라고 밝혔습니다.

WorldCat은 비영리 도서관 목록인 Online Computer Library Center(OCLC)에 참가하는 7만 1,000개 이상의 도서관 장서를 목록화한 인덱스로 90개국 이상에서 도서관이 참여하여 정보를 모으고 있습니다.

WorldCat.org
https://www.worldcat.org/ko

WorldCat.org

WorldCat.org는 도서관 자료의 글로벌 카탈로그입니다. 가까운 도서관에서 책, 음악, 비디오, 기사 등을 검색할 수 있습니다.

www.worldcat.org



WorldCat의 데이터베이스는 독점적이며 자유롭게 사용할 수 없지만 Anna's Archive는 데이터베이스 제한을 피하여 자신의 사본을 만듭니다. Anna's Archive는 "OCLC는 비영리 단체이지만 비즈니스 모델은 데이터베이스 보호를 필요로 합니다. Anna's Archive는 최종적으로 중복을 제외하면 약 7억 건의 데이터가 기록되어 3 테라바이트 정도의 메타데이터를 수집하는 데 성공했다고 합니다.

Anna's Archive가 WorldCat에서 수집한 것은 메타데이터이며 직접 도서의 해적판 사본을 얻을 수 없기 때문에 일반 사용자에게 유용하지 않은 경우가 대부분입니다. 그러나 주로 저작권 침해와 디지털 권리에 관한 뉴스를 다루는 TorrentFreak의 취재에 대해 Anna의 Archive는 "우리는이 사이트의 출시가 전 세계 모든 도서의 지도를 만드는 데 큰 이정표가 될 것이라고 생각합니다. 우리는 세계의 모든 책을 보존하려고 합니다만, 그러기 위해서는 '세계의 모든 책은 어느 정도'라는 분모가 필요합니다. 메타데이터를 수집하면 지금부터 저장해야 하는 모든 책 목록을 만들 수 있습니다. 이것은 도서관 전체에서 많은 사람들과 기관이 작업해야 하는 대규모 사업이며, 우리는 이 노력의 기초가 되고 싶습니다."라고 말합니다.


또한 Anna's Archive의 블로그에는 대규모 언어 모델(LLM)을 사용하는 기업 및 그룹에 대한 호소도 기재되어 있습니다. 대규모 라이브러리는 LLM 교육에 이상적이기 때문에 Anna 's Archive는 컬렉션에 빠르게 액세스 할 수 있도록 특별 프로그램을 시작했다는 것입니다. 실제로 매일 LLM 관계자로부터 연락을 받고 적극적으로 협력하고 있다고 밝히고 있습니다.

반응형