Microsoft의 연구자들이 Excel이나 Google 스프레드시트와 같이, 기존의 AI에서는 이해하기 어려운 처리를 염두에 둔 언어 모델 「SpreadsheetLLM」을 발표했습니다.
[2407.09025] SpreadsheetLLM: Encoding Spreadsheets for Large Language Models
https://arxiv.org/abs/2407.09025
Microsoft's experimental SpreadsheetLLM helps AI better understand spreadsheets - SiliconANGLE
https://siliconangle.com/2024/
2024년 7월 12일 프리프린트 서버 arXiv에 게재된 논문에서 Microsoft 연구팀은 스프레드시트를 언어 모델에서도 이해하기 쉬운 형식으로 변환하는 어프로치를 채용한 「SpreadsheetLLM」을 발표했습니다.
이 접근법에서는 연구팀이 개발한 'SheetCompressor'가 스프레드시트를 인코딩하고 압축하여 언어 모델이 이해하고 분석하기 쉬운 데이터로 변환합니다. 이를 통해 GPT-4 및 Llama 2와 같은 다양한 LLM이 스프레드시트를 보다 깊이 이해할 수 있게 되었습니다.
SheetCompressor는 테이블 구조를 정의하는 중요한 행과 열을 식별하는 「효율적인 레이아웃 이해를 위한 구조적 앵커」,
비어 있지 않은 셀의 텍스트를 인덱싱하여 데이터 무결성을 유지하면서 토큰 사용을 최적화하는 「토큰의 효율화를 위한 전치 인덱스 번역」,
같은 형식이나 수치의 셀을 그룹화해 사용하는 토큰을 저감 시키는 「수치 셀의 데이터 포맷 집계」 의 3개 컴포넌트로 구성됩니다.
연구팀에 따르면 SheetCompressor를 사용하면 데이터가 최대 96% 압축되므로 LLM이 토큰 제한 내에서 대규모 데이터 세트를 처리할 수 있게 된다고 합니다.
SpreadsheetLLM의 장점은 스프레드시트의 데이터에 대한 접근성을 개선하고 이해하기 쉽도록 할 수 있다는 점입니다. LLM의 힘을 통해 사용자는 복잡한 수식이나 프로그래밍 언어가 아닌 자연어 처리로 스프레드시트를 참조하거나 만들 수 있으므로 조직 내에서 더 많은 개인이 데이터를 기반으로 의사 결정을 내릴 수 있습니다.
또한 SpreadsheetLLM은 데이터 정리, 포맷, 집계 등 스프레드시트의 데이터 분석에 필요한 까다로운 작업을 자동화할 수 있기 때문에 직원은 더 가치 있는 업무에 필요한 리소스를 늘릴 수 있습니다.
Microsoft는 이미 Microsoft 365 Copilot과 같은 제품으로 오피스 스위트와 AI의 통합을 진행하고 있으며, SpreadsheetLLM의 등장에 의해 스프레드 시트에서도 AI를 활용할 수 있게 될 가능성이 나왔습니다.
SpreadsheetLLM이 공식적으로 출시될지 여부는 확실하지 않지만, IT 뉴스 사이트 VentureBeat는 "SpreadsheetLLM이 연구에서 실제로 사용할 수 있는 응용 프로그램으로 전환할 때 스프레드 시트에서의 작업이 어떻게 변화하고 엔터프라이즈의 데이터 주도 의사결정에 어떤 잠재력을 가져다 줄지 기대하고 있다」 라고 코멘트했습니다.
이제 엑셀 상급자로 가기 위한 공부는 안 해도 되는 건가?...
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
Stability AI가 1개의 동영상에서 다른 8개 앵글의 동영상을 생성하는 AI 모델 「Stable Video 4D」 를 발표 (1) | 2024.07.26 |
---|---|
코드 생성 · 수학 · 추론 능력이 대폭 향상된 「Mistral Large 2」 출시 (1) | 2024.07.26 |
Mistral AI가 코드 생성 특화형 AI 「Codestral Mamba」 를 오픈 소스 라이센스로 출시 (1) | 2024.07.22 |
OpenAI가 「정확하고 알기 쉬운 문장을 출력하는 AI」의 개발 방법을 공개 (0) | 2024.07.19 |
세계 제일의 AI 미인, Miss AI의 결과 발표 (1) | 2024.07.15 |
영화의 전편 모두를 생성 AI로 제작하는 옴니버스 영화 (0) | 2024.07.11 |
중국의 Tencent가 NVIDIA에 의존하지 않고 자사제 AI 인프라 학습 능력을 20% 강화 (1) | 2024.07.10 |
무료로 음성의 배경 노이즈를 제거해 주는 AI 툴 「Voice Isolator」를 ElevenLabs가 공개 (1) | 2024.07.10 |