一、头条推荐系统的本质
说白了,这个系统就是把最合适的内容送到最感兴趣的人眼前。
系统一边给作品贴上各种标签,一边给用户画像,完成之后,系统就开始“牵线搭桥”了,然后把用户可能喜欢的内容精准地推过去,这就是推荐系统。
给用户推送内容,系统主要看三个关键点:内容本身、用户的特点,还有用户对内容到底有多感兴趣。
对于内容,系统会用关键词提取和AI技术去识别,给内容贴上各种标签,然后分门别类地放到不同的领域里,像教育、体育、职场这些。比如,一篇关于篮球的文章,系统就会把它归到体育类。
对于用户画像,系统会收集用户的性别、年龄、地域、职业等基础信息,而且还会通过用户以前浏览过的内容,就是用户历史行为,分析用户喜欢看什么,不喜欢看什么,去更深的了解用户的喜好与需求。
比如,如果一篇内容推给用户,用户连点都不点,那系统就会想:这用户可能不感兴趣。如果用户点了进去了,但又很快就退出,也不点赞、评论,甚至点了个“不喜欢”,那系统就会觉得,虽然内容可能戳中了用户的某个兴趣点,但内容质量不行,用户不满意。反过来,如果用户不仅点击阅读,还点赞、评论、收藏,甚至关注了作者,那系统就会觉得:这用户对内容很满意,而且内容质量也挺高!
最后,系统会综合上面各种因素,把最合适的内容最好的内容,推送给真正感兴趣的用户手机屏幕前。这就是推荐系统的工作原理!
二、内容的审核、冷启动、推荐、复核流程
创作者内容刚发出去,先得过初审这一关,如果能通过审核,开始推荐;如果不通过,要么被限制推荐限流。
初审主要是看内容是否符合平台规则、有没有违反国家的法律法规,这个过程是机器和人工一起配合完成的。
一般来说,初审速度挺快的,基本1分钟内就能搞定。但要是遇到过年过节,或者有大型赛事、活动的时候,初审时间就会稍微长一点。
初审通过后,就进入冷启动环节了。因为平台和系统也不知道新发的内容质量怎样,用户喜欢不喜欢,所以会先推送给一小波人进行试水,大概展示几百几千次,通过用户的反馈,系统就能大概知道哪些人喜欢这个作品,哪些人不喜欢。
经过冷启动阶段,系统已经收集到了一些基础数据。如果一篇内容的数据表现很好,系统就会觉得内容质量不错,有潜力,会加大推荐力度;如果数据不行,推荐就会减少。
正常推荐过程中,系统会监测作品的各种数据,比如用户的点赞收藏评论等,如果负面反馈数据很高,作品就会再次进行复审,减少或停止推荐。
如果内容比较优质,会继续加大推荐力度,进入下一个更大的流量池,推送给更多的人看,如果用户反馈还是很好,则继续推送更多的人,一直这样循环往复的进行。
这一切的流量,最终目的就是保证最好内容推给最需要的用户。