본문 바로가기
AI · 인공지능/AI 칼럼

틱톡(TikTok)은 왜 사용자를 사로잡은 것일까? - 사용자를 매혹시키는 AI 알고리즘[후편]

by 두우우부 2020. 11. 20.
반응형

 

 

목차

3. TikTok 추천의 흐름

  • 0 단계 : 사용자 생성 콘텐츠(UGC)에 관한 듀얼 감시 시스템
  • 1 단계 : 콜드 스타트
  • 2 단계 : 지표에 따른 평가
  • 3 단계 : 사용자 프로필 증폭기
  • 4 단계 : 부티크 트렌드 풀
  • 기타 단계 : 지연 발화
  • 제한 : 트래픽 피킹
  • 왜 이런 추천 시스템을 만들었는가
  • 참고 URL

 

3. TikTok 추천의 흐름

TikTok은 그 핵심 알고리즘을 결코 공개하지 않았습니다. 그러나 회사를 통해 게시된 단편적인 정보와 리버스 엔지니어링 기술을 사용하여 사람들이 발견한 흔적을 따라 저는 다음과 같은 결론을 이끌어 냈습니다.(이것은 저의 추정이며, TikTok이 실제로 실행하고 있는 것과 상이할 수 있습니다.)

 

추천의 워크 플로우 - Catherine Wang 작성, (무단 전재 금지)

 

단계 0 : 사용자 생성 콘텐츠(UGC)에 관한 듀오 감사 시스템

TikTok에는 매일 수백만의 콘텐츠가 업로드되고 있습니다. 악성 콘텐츠들은 기계에 의한 심사 시스템의 허점을 쉽게 찾아내며, 그렇다고 전부 수기로 심사하는 것은 현실적으로 불가능합니다. 따라서 기계와 인간이 협동하여 심사하는 듀오 리뷰가 TikTok의 동영상 콘텐츠를 선별하는 주요 알고리즘이 됩니다.

 

기계 리뷰 : 일반적으로 말하면, (컴퓨터 비전에 기반한) 듀얼 감시 모델은 동영상 이미지와 키워드를 식별할 수 있습니다. 이 모델은 주로 2가지의 주요 기능이 있습니다. 

 

1) 클립에 위반 사항이 있는지 여부를 검토하고 저작권도 체크합니다. 위반이 의심되는 경우 콘텐츠는 모델에 의해 제한을 받고, 인간에 의한 재검토를 위해 노란색 또는 빨간색으로 태그 됩니다. 

 

2) TikTok의 듀얼 감시 알고리즘은 동영상에서 이미지와 키 프레임을 추출하여 추출된 정보를 방대하게 아카이브 된 콘텐츠 베이스와 대조합니다. 중복되는 부분은 픽업되어 보다 낮은 트래픽 경로로 보내져 추천 엔진의 부하를 줄여줍니다.

 

가이드 리뷰 : 이 리뷰는 주로 영화 제목, 커버 썸네일, 동영상 키 프레임이라는 세 가지 영역에 초점을 맞추고 있습니다. 듀얼 모니터 모델에서 의심스러운 콘텐츠로 태그 된 것에 대해서는 전임 담당자가 수동으로 리뷰를 실시합니다. 규정을 위반하고 있다고 판단된 경우에는 동영상을 삭제하고 계정을 정지합니다.

 

1 단계 : 콜드 스타트

TikTok이 추천하는 구조의 핵심은 정보 흐름 깔때기(Information Flow Funnel)입니다. 콘텐츠 듀얼 감시 모델의 심사를 통과하면 콜드 스타트 트래픽 풀에 들어갑니다. 예를 들어, 새로운 동영상이 심사를 통과하면 TikTok은 이 동영상에 200 ~ 300 명의 액티브 유저로 초기 트래픽을 할당하고 거기서 동영상은 최대 수천 명의 시청자에게 노출됩니다.

 

이상의 메커니즘에서 새로운 크리에이터는 (수만 명의 팔로워가 있을지도 모르는) 소셜 인플루언서와 경쟁할 수 있습니다. 왜냐하면 출발점이 같기 때문입니다.

 

 

 

2 단계 : 지표에 따라 평가

초기 트래픽 풀을 통해 동영상이 수천 번의 조회수를 얻었는지, 더 얻을 수 있을지, 열람에 관한 데이터를 수집 및 분석합니다. 분석에서 고려해야 할 지표는 좋아요, 조회수, 전체보기, 의견, 팔로워, 리포스트 공유 등이 있습니다.

 

그리고 추천 엔진은 이러한 초기 지표와 (고품질 크리에이터인지 여부를 판단하는) 사용자 계정 점수에 따라 사용자의 콘텐츠를 평가합니다. 엔진이 해당 콘텐츠를 중요하다고 판단하는 경우, 특히 상위 10%로 판단한 경우에는 추가로 10,000 ~ 100,000 트래픽에 노출이 적당하다고 피드백됩니다.

 

3 단계 : 사용자 프로필 증폭기

2단계 트래픽 풀에서 얻은 피드백은 사용자 프로필 증폭기의 사용에 합당한 결정을 위해 추가로 분석됩니다. 이 단계에서는 특정 사용자 그룹(예를 들어, 스포츠 팬, 패션 애호가)에서 우수하다고 판단된 콘텐츠는 강화되고 증폭됩니다.

 

콘텐츠의 강화 및 증폭 과정은 "이런 것도 좋아할지도"기능의 콘셉트와 비슷합니다. 추천 엔진은 콘텐츠와 사용자 그룹 간의 최적의 매칭을 찾을 수 있도록 하기 위해 사용자의 프로필 기반을 구축합니다.

 

4 단계 : 부티크 트렌드 풀

콘텐츠의 1% 미만이 최종 트렌딩 풀에 들어갑니다. 이 풀에 들어간 콘텐츠가 얻는 노출량은 다른 것보다 몇 배나 많습니다. 왜냐하면 트렌딩 콘텐츠는 모든 사용자에게 무차별적으로 추천되기 때문입니다.

 

기타 단계 : 지연 발화(発火)

일부 Tiktokers는 평균적인 퍼포먼스로 게시해도, 몇 주 후에 갑자기 자신들의 콘텐츠가 크게 히트 칠 수 있다는 것을 눈치채고 있습니다. 이상현상이 발생하는 것은 주로 두 가지 이유입니다.

 

첫째, TikTok은 오래된 콘텐츠를 재발견하거나, 노출할 후보가 될 고품질의 콘텐츠를 발굴하거나 하는 알고리즘(통칭 gravedigger : 무덤 파는 사람)을 가지고 있습니다. 당신의 콘텐츠가 이 알고리즘에 의해 선택되었을 경우, 당신의 계정은 알고리즘으로부터 새 라벨을 얻기에 충분할 정도로 눈에 띄는 동영상을 가지고 있다는 것을 의미합니다. 이 라벨이 있는 것으로, gravedigger 알고리즘은 점점 당신의 콘텐츠를 잘 찾을 수 있게 됩니다.

 

둘째, '트렌디 효과'가 있습니다. 이 효과는 귀하의 콘텐츠 중 하나가 수백만 번의 조회수를 얻을 경우, 당신의 메인 페이지에 트래픽을 유도하고, 그 결과로 TikTok 사용자가 당신의 오래된 콘텐츠를 볼 수 있는 기회가 증가하는 것을 의미합니다. 이 효과는 뛰어난 크리에이터(ex : 귀여운 고양이 동영상 제작자)에서 자주 발생합니다. 하나의 트렌디한 동영상이 다른 모든 고품질 동영상에 불을 붙일 것입니다(사람들은 당신의 귀여운 고양이를 더 보고 싶어 합니다.)

 

 

 

제한 : 트래픽 피킹

어는 하나의 콘텐츠 군이 위에 설명한 정보의 흐름을 여과시키는 깔때기(듀얼 모니터 모델 평가의 반복과 증폭기)를 통과하면 크리에이터의 계정은 과도할 정도로 노출이 되고 사용자와 상호 작용을 통해 팬들을 확보합니다.

 

그러나 이 높은 노출 시간의 창문이 열려있는 시간은 연구에 따르면 짧습니다. 일반적으로 이 이 창은 1주일 전후로 종료됩니다. 이 기간이 지나면 높은 노출의 콘텐츠나 계정이 가지고 있던 열기가 식어 가고, 화제성 영상을 따르는 유사한 영상들 마저도 화제성이 사라져 갑니다.

 

왜 이런 추천 시스템을 만들었는가

그 주된 이유는 TikTok이 다양성을 도입하고 알고리즘의 의도치 않은 바이어스(편향)를 없애고 싶기 때문입니다. 이상으로 해설 한 디자인으로 추천 엔진은 특정 유형의 콘텐츠에 기댈 수 없고, 따라서 새로운 콘텐츠가 트렌드 풀에 들어갈 기회를 평등하게 얻을 수 있게 되는 것입니다.

 

참고 URL

 

Sensor Tower - Mobile App Store Marketing Intelligence

Our App Store Optimization (ASO) and Store Intelligence products give vital keyword and competitive data so you can improve visibility, performance and ROI.

sensortower.com

 

Programming Collective Intelligence

Want to tap the power behind search rankings, product recommendations, social bookmarking, and online matchmaking? This fascinating book demonstrates how you can build Web 2.0 applications to mine the enormous … - Selection from Programming Collective In

www.oreilly.com

 

Wikipedia, the free encyclopedia

From Wikipedia, the free encyclopedia Jump to navigation Jump to search From today's featured article 2019 Women's Boat Race trophy The Boat Race 2019 took place on 7 April 2019. Held annually, The Boat Race is a side-by-side rowing race between crews fr

en.wikipedia.org

 

The 20 Biggest TikTok Statistics: Key Facts, Figures & Data [2020]

TikTok has plowed ahead as one of the fastest-growing social media apps on the market. Find the top TikTok statistics and demographics for marketers here:

mediakix.com

 

TikTok Revenue and Usage Statistics (2020)

TikTok, known as Douyin in its home market, was launched in China in September 2016. It was pushed out globally as TikTok the following year. The TikTok app allows users to create 15 second videos, soundtracked by music clips. Sounds simple enough, but it

www.businessofapps.com

 

반응형