반응형 Streaming LLM1 대규모 언어 모델에서 '무한 입력'을 가능하게 해주는 기법 「StreamingLLM」이 등장 계산 비용과 성능을 유지한 채 무한한 입력을 처리할 수 있는 대규모 언어 모델 기법 「StreamingLLM」의 논문이 2023년 9월 29일에 공개되었습니다. 입력이 길어짐에 따라 첫 번째 정보는 손실되기 때문에 책 요약 등의 작업에는 적합하지 않지만 대화가 길어도 성능을 유지하면서 원활하게 답변할 수 있다고 합니다. mit-han-lab/streaming-llm: Efficient Streaming Language Models with Attention Sinks https://github.com/mit-han-lab/streaming-llm GitHub - mit-han-lab/streaming-llm: Efficient Streaming Language Models with Attention Si.. 2023. 10. 4. 이전 1 다음 반응형