반응형
미국 메릴랜드 대학의 연구팀이 대규모 언어 모델(LLM)의 출력 텍스트에 전자 워터마크(watermark)를 내장하는 프레임워크에 관한 논문 'A Watermark for Large Language Models'를 발표했습니다.
https://arxiv.org/abs/2301.10226
이 기술은 텍스트의 품질을 손상시키지 않고 보이지 않는 형태로 전자 워터 마크를 통합할 수 있도록 합니다.
특정 API 및 매개 변수에 대한 액세스가 필요치 않으며, 효율적인 오픈소스 알고리즘을 사용하여 전자 워터마크를 감지할 수 있습니다. 또한 LLM을 가동하지 않고 저렴한 비용으로 신속하게 검출이 가능합니다.
악의적인 목적으로의 사용 리스크가 증가하고 있는 LLM이지만, 모델 출력에 전자 워터마크를 심는 것으로 리스크를 완화할 수 있습니다. 또한 합성 데이터는 인간의 콘텐츠보다 열등한 경우가 많고, 모델의 훈련에 앞서 검출하여 제외할 필요가 있지만, 이에도 이용할 수 있습니다.
이 방법은 인간은 인식할 수 없지만, 짧은 토큰의 범위로부터 알고리즘으로 검출 가능한 신호를 생성 텍스트에 심는 방법입니다.
보다 구체적으로, 토큰은 이전 토큰의 해시 값에 기초하여 '그린 토큰'과 '레드 토큰'으로 분류하고, 생성된 텍스트는 '그린 토큰'의 비율이 높아지도록 설정됩니다. 두 토큰의 비율을 분석하면 텍스트에 전자 워터마크가 있는지 여부를 판단할 수 있다는 것입니다.
반응형
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
디즈니가 대규모 AI 도입을 위한 태스크포스 설립, 새로운 전문가를 구인중 (2) | 2023.08.21 |
---|---|
AI로 생성된 그라비아가 「Kindle Unlimited」 에서 대인기, 언캐니 밸리를 넘었나 (2) | 2023.08.21 |
대화형 AI 컨택 센터가 시장에서 꾸준히 성장할 것으로 Gartner가 분석 (1) | 2023.08.21 |
IBM과 NASA가 Hugging Face에서 지리공간 AI 기반 모델을 공개, 오픈소스로 이용 가능 (1) | 2023.08.21 |
생성 AI도입이 기업의 가치 격차 확대, 인간의 노동을 AI로 대체 가능한 기업일수록 현금 흐름이 증가 (1) | 2023.08.18 |
2023년판 하이프 사이클에 따르면 생성 AI는 「과도한 기대의 피크기」 (1) | 2023.08.18 |
Google 검색에 생성 AI를 통합, Search Generative Experience(SGE) 테스트를 시작 (1) | 2023.08.18 |
Amazon이 "대량의 고객 리뷰를 AI가 요약하고 정리하는 기능"을 도입한다고 발표 (2) | 2023.08.16 |