AI가 작성한 문장에 「전자 워터마크」를 삽입하여 인간의 문장과 구별하는 기법을 미국 대학이 개발

미국 메릴랜드 대학의 연구팀이 대규모 언어 모델(LLM)의 출력 텍스트에 전자 워터마크(watermark)를 내장하는 프레임워크에 관한 논문 'A Watermark for Large Language Models'를 발표했습니다.

https://arxiv.org/abs/2301.10226

A Watermark for Large Language Models

Potential harms of large language models can be mitigated by watermarking model output, i.e., embedding signals into generated text that are invisible to humans but algorithmically detectable from a short span of tokens. We propose a watermarking framework

arxiv.org

이 기술은 텍스트의 품질을 손상시키지 않고 보이지 않는 형태로 전자 워터 마크를 통합할 수 있도록 합니다.

특정 API 및 매개 변수에 대한 액세스가 필요치 않으며, 효율적인 오픈소스 알고리즘을 사용하여 전자 워터마크를 감지할 수 있습니다. 또한 LLM을 가동하지 않고 저렴한 비용으로 신속하게 검출이 가능합니다.

악의적인 목적으로의 사용 리스크가 증가하고 있는 LLM이지만, 모델 출력에 전자 워터마크를 심는 것으로 리스크를 완화할 수 있습니다. 또한 합성 데이터는 인간의 콘텐츠보다 열등한 경우가 많고, 모델의 훈련에 앞서 검출하여 제외할 필요가 있지만, 이에도 이용할 수 있습니다.

이 방법은 인간은 인식할 수 없지만, 짧은 토큰의 범위로부터 알고리즘으로 검출 가능한 신호를 생성 텍스트에 심는 방법입니다.

보다 구체적으로, 토큰은 이전 토큰의 해시 값에 기초하여 '그린 토큰'과 '레드 토큰'으로 분류하고, 생성된 텍스트는 '그린 토큰'의 비율이 높아지도록 설정됩니다. 두 토큰의 비율을 분석하면 텍스트에 전자 워터마크가 있는지 여부를 판단할 수 있다는 것입니다.

저작자표시 비영리 변경금지 (새창열림)

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

디즈니가 대규모 AI 도입을 위한 태스크포스 설립, 새로운 전문가를 구인중 (2)	2023.08.21
AI로 생성된 그라비아가 「Kindle Unlimited」 에서 대인기, 언캐니 밸리를 넘었나 (2)	2023.08.21
대화형 AI 컨택 센터가 시장에서 꾸준히 성장할 것으로 Gartner가 분석 (1)	2023.08.21
IBM과 NASA가 Hugging Face에서 지리공간 AI 기반 모델을 공개, 오픈소스로 이용 가능 (1)	2023.08.21
생성 AI도입이 기업의 가치 격차 확대, 인간의 노동을 AI로 대체 가능한 기업일수록 현금 흐름이 증가 (2)	2023.08.18
2023년판 하이프 사이클에 따르면 생성 AI는 「과도한 기대의 피크기」 (1)	2023.08.18
Google 검색에 생성 AI를 통합, Search Generative Experience(SGE) 테스트를 시작 (1)	2023.08.18
Amazon이 "대량의 고객 리뷰를 AI가 요약하고 정리하는 기능"을 도입한다고 발표 (2)	2023.08.16

두우우부

AI가 작성한 문장에 「전자 워터마크」를 삽입하여 인간의 문장과 구별하는 기법을 미국 대학이 개발

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

AI가 작성한 문장에 「전자 워터마크」를 삽입하여 인간의 문장과 구별하는 기법을 미국 대학이 개발

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바