본문 바로가기
AI · 인공지능/AI 뉴스

오픈인가, 폐쇄인가? Stability AI가 점치는 생성 AI의 미래

by 두우우부 2023. 5. 18.
반응형

 

2023년 5월 11일, 일본의 AI·인공지능 EXPO에서 Stability AI Japan의 Head of Japan을 맡고 있는 Jerry Chi 씨에 의한  생성 AI의 지금과 미래」 라는 강연이 있었습니다.

Jerry Chi 씨 프로필
Jerry는 도쿄를 거점으로 활약하는 대만계 미국인으로 4개 국어가 가능합니다. 지금까지 그는 Google, Supercell, SmartNews, Indeed에서 애널리틱스 및 기계 학습 관련 다양한 직책을 경험해 왔습니다. 또한 기업가로서의 경험을 살려 여러 스타트업에서 어드바이저 역할을 하고 있습니다. Jerry의 목표는 생성계 AI 및 기계 학습을 크리에이티브 분야에 응용하는 것입니다. 스탠퍼드 대학 공학부와 펜실베이니아 대학 와튼 스쿨 졸업.


2022년 후반부터 시작된 스테이블 디퓨전의 파도

'Stable Diffusion'을 Stability AI가 발표한 것은 2022년 9월입니다. 1개월 만에 API 이용자가 100만 명을 돌파하고, 12월에는 이용자가 1,000만 명을 돌파, 2023년 1월에는 일본법인이 설립되어, 4월에는 대규모 언어 모델 「Stable LM」도 릴리즈하고 있습니다.



Stable Diffusion의 기능도 잇달아 추가되고 있습니다. 이미지를 생성할 때 크기 등 복수의 variation(변형)을 생성하는 기능과 자연언어와 선, 골격 정보를 이용한 이미지 편집 기능, 이미지를 고해상도로 바꾸는 이미지 업 스케일링 API도 공개하고 있습니다.

생성 AI 사례도 폭발적으로 늘고 있습니다. 아래는 Jerry 씨가 제시한 일례이지만, Corridor Digital라는 애니메이션 제작회사에 의한 것으로, 배우를 녹색 배경에서 촬영하고, Stable Diffusion을 이용해 애니메이션 화하고 있습니다. 그는 "2개월 전의 사례이므로 이미 오래된 기술"이라고 코멘트.

VFX Reveal Before & After - Anime Rock, Paper, Scissors | YouTube


AI 모델은 과점될 것인가, 민주화될 것인가

이어 Jerry 씨는 최근 AI 트렌드를 설명했습니다.

"생성 AI에 관한 논문은 기하급수적으로 증가하고 있습니다. 생성 AI의 시장규모는 2030년에는 200조 원에 이를 것으로 예상하고 있으며, AI에 대한 투자는 폭발적으로 증가하고 있습니다. 이것은 생성 AI가 이렇게 주류가 되기 이전의 수치로, 지금은 더 증가하고 있을 것입니다."


또한 Microsoft와 OpenAI, AWS와 Stability AI, Google과 Cohere, Google과 Anthropic 등 대기업 IT 기업과 스타트업의 파트너십이 늘고 있다고 지적, 생성 AI의 기술 스택을 보여주며, 현재는 대기업 IT 기업에 의한 대규모 언어 모델의 API 공개로 인해 생성 AI를 활용한 애플리케이션 개발의 진입 장벽이 크게 떨어지고 있다고 밝혔습니다.

이어 Jerry 씨는 생성 AI의 미래에 대해 청중에게 질문을 던졌습니다. 
빅테크에 의한 AI 모델이 과점하는 시나리오 A와,
다수의 기업이 고성능 오픈 소스 AI 모델을 직접 보유하고 사용하는 AI 민주화 루트의 시나리오 B,
어느 것으로 예상됩니까?라는 질문.


시나리오 A는 클로즈드 모델이며, API 사용료도 비쌉니다. 
시나리오 B는 공개 모델이며, 무료 또는 저렴하게 모델을 사용할 수 있습니다. 

현장에서는 시나리오 B가 다수파였습니다.

"저도 시나리오 B입니다.
즉 AI는 민주화해 나갈 것 같아요. 요 전날 Google의 내부 자료가 유출되었다는 뉴스가 있었습니다. 그중 구글의 연구자는, '오픈 소스에는 이길 수 없다. 우리 모델에는 진입장벽이 없다'라고 했습니다.”


그러나, Jerry 씨에 의하면, 아래의 요인으로 인하여 시나리오 A가 현시점에서는 더욱 현실적이라고 합니다.

성능 증류가 가능
최첨단 모델이 폐쇄되어도 최첨단 모델의 출력을 다른 모델의 트레이닝에 사용하면 최첨단 모델의 성능을 학습 가능합니다.

  *성능(지식) 증류란?
   소금물을 증류하면 소금물의 농도가 진해지듯, 모델의 크기는 줄이되 중요한 부분을 남기는 방법을 말한다.

가격 우위
오픈된 AI 모델은 대부분의 경우에 저렴하게 사용할 수 있습니다.

커뮤니티의 존재
오픈 소스 커뮤니티는 정열적인 연구자, 개발자, 제작자 및 유력한 사용자가 있지만, 클로즈드 소스에서는 한 기업의 기껏해야 수백 명만 모델 개선에 기여할 수 있습니다.

커스터마이징
오픈 소스는 다양한 사용 사례로 모델을 사용자 정의하기 쉽습니다.


즉,
이러한 이유로 인해 다수의 기업에서는 오픈 소스 AI 대신 클로즈드 AI를 택할 것이며, 그로 인해 빅테크에 의한 시나리오 A가 힘을 얻을 것이라는 것.

또한, 자신이 시나리오 B를 지지하는 이유로, 오픈 소스에서 작동하는 네트워크 효과를 들고 있습니다. 개인의 개선뿐만 아니라, 그것을 공유하는 것으로, 크리에이터나 팬, 개발자가 서로 접촉해, 개선의 선순환이 이뤄집니다. 이러한 부분에서 오픈 모델이라면 파생 모델도 태어나기 쉽다고 Jerry 씨는 말하고 있습니다.

또한, ChatGPT 등 대화형 AI로 문제가 되고 있는 내용의 정확성에 대해서는,
인간이나 다른 툴로 사후 확인을 실시하는 것,
생성 AI와 다른 시스템과의 제휴로 완화하는 것,
애당초 100%의 정확 성을 요구하지 않는 것이 좋다는 것을 들고 있습니다.
클로즈드≒블랙박스인 모델은 제품에 관해 설명할 수 없다는 점도 지적합니다.
오픈 모델을 선택해 자사가 선택한 환경에서 사용하는 것이 중요하다는 것입니다.

「생성 AI에 있어서, 가장 큰 패러다임 시프트는, '불가능'이 '가능'으로 바뀌는 것입니다. 그림을 못 그리는 소설가가 만화가가 될 수도 있고, 자연어로 소프트웨어를 개발하는 일도 지금은 할 수 있게 되었습니다. 향후에는 스스로 선택해, 조합하는 것으로 목적을 달성하는, 프로듀서적인 스킬이 더욱 중요하게 될 것입니다

반응형