본문 바로가기
반응형

분류 전체보기1836

Apple이 이미지를 보고 질문에 답할 수 있는 대규모 언어 모델 'Ferret'을 개발 이미지와 텍스트를 결합하여 작업을 수행할 수 있는 멀티모달 대규모 언어 모델인 Ferret 의 가중치 정보를 Apple이 공개했습니다. 가중치 데이터는 CC-BY-NC 라이센스로 제공되며 연구 목적으로만 사용할 수 있습니다. apple/ml-ferret https://github.com/apple/ml-ferret GitHub - apple/ml-ferretContribute to apple/ml-ferret development by creating an account on GitHub.github.com Ferret은 2023년 10월 30일에 공개된 멀티모달 대규모 언어 모델로 이미지의 영역을 지정해 해석할 수 있다는 것이 특징입니다. 영역의 지정 방법에는 「점」, 「사각형」, 「프리 폼」의 3 종.. 2023. 12. 26.
Facebook은 이미 AI가 만든 가짜 게시물로 가득 차 있다 한때 예언되었던 「생성 AI가 대량 생산한 쓰레기 콘텐츠가 인간의 노력을 압도한다」라는 미래가 이미 현실이 되었다고, IT계 뉴스 사이트 404 Media가 보도했습니다. Facebook Is Being Overrun With Stolen, AI-Generated Images That People Think Are Real Facebook Is Being Overrun With Stolen, AI-Generated Images That People Think Are RealThe once-prophesized future where cheap, AI-generated trash content floods out the hard work of real humans is already here, and is.. 2023. 12. 21.
Microsoft가 LLM의 입력 프롬프트의 의미를 유지하면서 고도로 압축하는 기술「LLMLingua」를 개발 대규모 언어 모델의 입력 프롬프트가 너무 길어지면 채팅 창의 상한을 초과하거나 API 비용이 증가하는 단점이 발생합니다. 그래서 Microsoft Research의 연구팀은 그 의미를 유지하면서도 입력 프롬프트를 압축해 내는 새로운 기술 「LLMLingua」를 개발했습니다. LLMLingua | Designing a Language for LLMs via Prompt Compression https://llmlingua.com/ 대규모 언어 모델에서 정밀한 답변을 얻으려면 프롬프트 엔지니어링이 필요하다는 것은 널리 알려져 있습니다. 그중 Chain-of-Thought(CoT: 사고의 연속)나 In-context Learning(ICL: 콘텍스트 내 학습) 등의 기술이 등장하고, 고품질의 답변을 이끌어내기.. 2023. 12. 20.
마침내 아이슬란드에서 화산이 분화, YouTube 라이브로 전송도 현지 시간인 2023년 12월 18일 22시 17분경, 아이슬란드 남서부의 레이캬네스 반도에서 하가펠 화산이 분화했습니다. 분화 지점은 연안부의 마을 · 그린다비크로부터 북동 약 4km로 정도로, 분화의 모습을 YouTube 라이브로 볼 수 있습니다. Emergency phase declared - Iceland Monitor Emergency phase declaredThe National Commissioner of the Icelandic Police, in agreement with the Commissioner of the Police in Suðurnes, has decided to enter the emergency phase of the Civil Protection Agency due t.. 2023. 12. 20.
Meta가 「Seamless Communication」공개, 화자 톤을 유지하면서 실시간으로 다언어 음성을 번역 미국의 메타는 2023년 11월 30일 언어 간 커뮤니케이션 장벽을 해소하기 위한 AI 모델군, 「Seamless Communication」을 공개했습니다. https://ai.meta.com/blog/seamless-communication/ Introducing a suite of AI language translation models that preserve expression and improve streamingEMMA is our core streaming algorithm, which allows us to intelligently decide when we have enough information to generate the next speech segment or target text... 2023. 12. 20.
한국의 연세대에서「망막 사진」으로 아이의 자폐증을 100% 분간하는 AI 모델을 발표 자폐 스펙트럼(ASD) 아이를 「망막의 사진」만으로 100% 정밀도로 분간하는 딥 러닝 AI 모델을 한국의 연세대 의학부 연구팀이 개발했습니다. ASD의 아이들을 조기 진단하는 객관적인 스크리닝 도구로서 AI가 유망한 선택이 될 수 있을 것으로 기대되고 있습니다. Development of Deep Ensembles to Screen for Autism and Symptom Severity Using Retinal Photographs | Ophthalmic Imaging | JAMA Network Open | JAMA Network Development of Deep Ensembles to Screen for Autism and Symptom SeverityThis diagnostic study exa.. 2023. 12. 20.
마음을 읽고 텍스트로 변환하는 「BrainGPT」가 결국 등장 2023년 12월 10일 ~ 16일에 걸쳐 행해진 기계 학습과 계산론적 신경과학 콘퍼런스인 「NeurIPS」에서 시드니 공과대학 연구팀에 의한 「생 뇌파를 직접 언어로 번역」하는 대규모 언어 모델 「BrainGPT」논문이 주목할만한 논문으로 선정되었습니다. New Mind-Reading "BrainGPT" Turns Thoughts Into Text On Screen | IFLScience New Mind-Reading "BrainGPT" Turns Thoughts Into Text On ScreenIt offers new hope to people unable to communicate in other ways.www.iflscience.com 실제로 인간의 생각을 읽는 실험 모습이 YouTube에 공.. 2023. 12. 19.
채팅 AI가 탑재된 어린이용 대화 장난감 「Grok」시리즈가 등장 아이와 이야기할 수 있는 장난감은 지금까지 존재했습니다만, 「녹음된 대사를 재생한다」가 아니라, 채팅 AI와의 대화할 수 있는 봉제인형으로서, 대화형 장난감 「Grok」시리즈가 등장했습니다. Curio AI Toys - Where Toys Come to Life Curio AI Toys - Where Toys Come to LifeHello! I'm Gabbo, your friendly and trusty robot. I'm always bubbling with enthusiasm to learn, play, and join you on imaginative adventures. Let's embark on some fun together!heycurio.com AI toy Grok talks to yo.. 2023. 12. 19.
중국발 로맨스 스캠, 「돼지 도살」로 천억 이상을 자금세탁한 남녀 4명이 기소 미국 사법성이 2023년 12월 14일에, 데이트 서비스 등을 사용한 연애 사기로 피해자로부터 받은 8,000만 달러(약 1,041억 원)의 자금을 국내외에 송금한 혐의로, 캘리포니아주 및 일리노이주에 사는 30대 ~ 40대 남녀 4명을 자금세탁 혐의로 기소했다고 발표했습니다. Office of Public Affairs | Four Individuals Charged for Laundering Millions from Cryptocurrency Investment Scams | United States Department of Justice Four Individuals Charged for Laundering Millions from Cryptocurrency Investment ScamsA seve.. 2023. 12. 19.
MP3 압축시 저하된 음질을 복구해 주는 플러그인「MAIM」 음성 데이터를 압축하는 기술은 다양하며, 특히 MP3 형식은 비가역 압축 코덱으로 가장 인기 있는 것 중 하나입니다. MP3에 의한 압축은 압축률을 높게 하거나 횟수를 겹치거나 하면 음질이 크게 저하되어 버립니다만, 그러한 압축에 의한 음질 저하를 복구해 주는 플러그인 「MAIM」이 등장했습니다. MAIM | Wildergarden https://wildergardenaudio.com/maim/ MAIM은 디지털 오디오 워크스테이션(DAW) 소프트웨어에서 사용할 수 있는 AU/VST3 플러그인으로 배포됩니다. MAIM의 UI는 다음과 같습니다. 인코더에는 LAME 및 BladeEnc가 내장되어 있습니다. LAME은 압축하여 비트 레이트를 낮추면, 고주파수 부분이 잘린 소리가 됩니다. BladeEnc는 낡.. 2023. 12. 19.
반응형