반응형 phi-11 MS가 GPT-3.5의 100분의 1 이하의 파라미터로 GPT-3.5를 웃도는 'phi-1' 발표 Microsoft Research의 AI 연구팀이 Transformer 기반 모델 phi-1을 발표했습니다. 이 모델은 파라미터 수가 GPT-3.5의 100분의 1 이하인 13억 밖에 안되는데도 테스트용 데이터 세트 HumanEval에서 GPT-3.5를 웃도는 성적을 거둔 것으로 보고되었습니다. [2306.11644] Textbooks Are All You Need https://doi.org/10.48550/arXiv.2306.11644 Microsoft Releases 1.3 Bn Parameter Language Model, Outperforms LLaMa Microsoft releases µTransfer, a new technique for hypertuning large neural netwo.. 2023. 6. 23. 이전 1 다음 반응형