반응형 GPT-4o 토큰 오염1 GPT-4o의 중국어 토큰은 포르노와 스팸으로 오염됨 OpenAI의 최신 AI 모델 "GPT-4o"가 발표되었습니다. 텍스트나 음성, 카메라 입력을 인간 수준의 속도로 처리 가능한 높은 성능으로 보도되고 있습니다만, 한편, 중국어 유저로부터는, 트레이닝에 큰 문제를 안고 있어, 토큰 데이터가 오염되어 있다고 지적했습니다. OpenAI 's GPT-4o has a Chinese Porn and Spam Problem - WinBuzzer https://winbuzzer.com/2024/05/18/gpt-4os-chinese-tokens-raise-concerns-over-data-quality-xcxwbn/ 문제를 지적한 것은 프린스턴 대학의 박사과정 학생으로 대규모 언어 모델의 추론 효율을 연구하고 있는 蔡天楽 씨입니다. AI는 입력된 문장을 '토큰'이라는.. 2024. 5. 21. 이전 1 다음 반응형