转:netflix推荐系统竞赛

2020-12-13 02:35

阅读:648

推荐无处不在

经过几年的积累我们发现,在Netflix中尽可能地集成推荐系统的个性化功能,会对我们的订阅用户产生巨大的价值。首页上的个性化包含了按行展示的视频,每一行有一个主题,主题揭示了这行视频的内在联系。大多数的个性化都是基于挑选行视频的方法,包括哪些行该放哪些视频,以及如何对视频排序。
以最顶部的10行为例:我们猜测你最可能喜欢这10个主题。当然,我们说“你”的时候也包含了你的家人。不得不提的是,Netflix的个性化是针对每一个家庭,而一个家庭的不同成员很有可能兴趣不一致。这也是为什么要选10行视频的原因,我们要为“爸爸“,”妈妈“,”小孩“或者整个家庭来做推荐。即使是这个家庭只有一个用户,那我们也想兼顾到这个用户的不同兴趣和情绪。正是因为如此,我们系统的目标不仅是准确性,还包括结果的离散程度。
soscw.com,搜素材

Netflix个性化系统的另一个重要元素是认知(awareness)。我们想让我们的用户知道我们是怎么把握到他们的喜好的。这不仅仅能使用户信任我们的系统,而且鼓励用户提交更多的反馈来帮助我们的推荐做到更好。个性化系统的另一个可以提升信任度的方式是提供推荐理由:为什么我们要推荐这部电影或剧集?不是因为它满足了我们的商业需求,而是基于我们从用户那里获得的信息(用户的评分、观看记录、用户朋友的推荐等等)。

soscw.com,搜素材
还有基于好友的推荐,我们最近刚刚在47个相关国家中的46个发布了我们的Facebook连接组件,只有美国除外,这是因为考虑到VPPA(《录像隐私权保护法案》,1998)的影响。通过了解朋友们在做什么,不仅仅为我们的推荐算法提供了另一个数据来源,也使我们能够以“社交圈”为主题生成几行新的推荐结果。

soscw.com,搜素材
我们的推荐服务中让人印象深刻的一点便是“风格”为主题的几行推荐结果。这里包含了像“喜剧”这样的大类,也包含了"时空穿越剧“这样的非常长尾的小类。每一行的展现都考虑了三个方面:选择哪一种风格;选这个风格里的哪些视频;这些视频如何排序。用户对这个模块的关注度是很高的,当我们把长尾的类别放到前面的时候,检测到用户停留时间有明显的增长。新颖性和多样性也是我们选择视频时要考虑的因素。
soscw.com,搜素材

我们也为每一行的选择提供了推荐理由,有些是基于隐式反馈:最近观看、用户评分和其他交互,有些是基于显式反馈,显式反馈是通过我们邀请用户做口味偏好测试得来的。

soscw.com,搜素材

基于相似性的推荐也是我们提供个性化服务的一方面。相似性是一个很宽泛的概念,描述的对象可以是不同的电影、用户,也可以是评分、视频元信息等。这些相似性的计算也会用于别的模块。基于相似性的推荐用在多种场景之中,例如当用户搜索一个电影或者把一部电影放到观看列表的时候,也可以用来生成”动态风格“的推荐结果,这些结果是基于用户最近看过的视频。

soscw.com,搜素材
soscw.com,搜素材

上述的场景,包括优选的10行推荐、风格推荐、基于相似性的推荐,都要涉及到排序算法,这是提供有效的推荐结果的关键一步。排序系统的目标是为不同的场景发现用户最感兴趣的视频。我们把排序系统分解为:评分、排序、过滤几部分。我们的商业目标是最大化用户的满意度和每月订阅比例,这实际上等价与最大化用户对视频的观看次数。因而我们把用户兴趣得分最高的视频推荐给用户。

现在我们很清楚,Netflix Prize对电影评分的预测,只是构建有效的推荐系统的众多组成的一种。我们也需要考虑像用户场景、视频流行度、新颖性、多样性、用户兴趣、可解释性等方方面面。为了兼顾这些要素,我们要挑选合适的算法。在下一部分,我们将要详细地讨论排序问题,同时也涉及到我们的数据和模型,以及我们为满足以上需求所做的创新。

第二部分


评论


亲,登录后才可以留言!