向Netflix学习解构影片-凡影周刊NO.44-【一文】-

2015-04-30 14:29

导语：

Netflix的影片推荐系统之所以独树一帜，是基于内部影片进行更加细分的归类，为此他们还聘请了员工专职看电影。这个影片推荐系统会为受众推荐好的热门电影，还会多样化地推荐长尾电影，一定程度上帮助Netflix控制内容采购成本，优化内容结构。本期【一文】就首先介绍Netflix是如何解构影片的。本期【一图】还展示了Netflix与HBO的竞争现状。最后，通过本期【一影】看看Netflix的职业电影观众——“标签员”是如何工作的。

正文：

如果你是Netflix的用户，你可能早已经对它极具针对性的影片推荐产生了好奇。这些推荐是如此精细和精准，以至于让人感觉不可思议：情感丰富的人机大战纪录片、基于现实生活的皇室古装片、20世纪80年代的欧洲魔鬼故事……

Netflix已经拥有多达4千万的用户，很难想象它需要多么复杂和庞大的个性化分类数据库去定义其内容库中的所有影片。这种个性化分类被称作“微类型”。Netflix雇佣并培训一群人，由他们对影片中的性暗示内容、暴力程度、浪漫桥段，甚至剧情叙事等元素做出精确的分类和评级。他们捕捉了数万种不同的电影属性，甚至给影片中虚拟人物的道德水平评级，当这些标签与数百万观众的习惯相结合，便成了Netflix的竞争优势。

Netflix的核心目标是吸引并留住其订阅用户，这些“微类型”就是他们公司战略的重要组成部分。Netflix在2012年的官方微博中写道，“我们给每个用户量身定制他们喜爱的微类型内容，这些内容与用户的观影习惯完美匹配。我们已经观测到订阅用户的黏度得到了有效提高。”

除去在用户体验上的提升，“微类型”也让Netflix在制作内容上拥有了绝佳的优势：Netflix已经建立了属于自己的美国观众观影偏好数据库。这个数据库虽然不能告诉导演或编剧该如何制作内容，却能告诉他们影视剧里需要什么样的元素。那么，这个“微类型”数据库到底是怎样的构成？有是如何运作的呢？

1.“微类型”数据库的构成

Netflix上，不同“微类型”的网址是按编号排列的，有人据此获取了“微类型”的完整数据库，并指出了以下几点发现：

1.1.不是所有的微类型都有其相匹配的影视剧

这些类型只是穷举了所有可能性，而不是对现有电影的归类。比如，第91,300类“自我感觉良好的浪漫西班牙语电视剧”就没有相对应的影片；第91,307类“视觉震撼的拉丁美洲喜剧”也仅仅对应了两部电影；而第6,037类“视觉震撼的浪漫剧情片”则对应了20部电影。实际上，Netflix现有76,897个用以划分已有影视剧的微类型。

1.2.Netflix有其特定“微标签”

影片来源地与数量惊人的名词性形容词（比如西部片和恐怖片）这些最终构成“微类型”的“微标签”在其数据库中不断重复出现。影片的创作来源（比如基于现实、基于古典文学）和影片的设定年代（比如爱德华七世时期）也经常出现。还有影片分级或观影级别（比如适合8-10岁）也是经常可以见到的。最有趣的是，这些描述能让我们从侧面了解典型的美国思维和个性。

向Netflix学习解构影片-凡影周刊NO.44-【一文】-

2.“微类型”数据库的“语法”

如果一部以浪漫主义为题材的影片获得过奥斯卡奖，那么“奥斯卡获奖”的描述总会被置于最前：“奥斯卡获奖浪漫剧情片”。而关于时代设定的修辞总会被置于最后：“奥斯卡获奖浪漫剧情片来自20世纪50年代”。单个形容词，例如浪漫，则会被简单地排列在一起，比如“奥斯卡获奖浪漫禁忌爱情片”。而内容主题则通常会放在最末：“奥斯卡获奖浪漫爱情片关于婚姻题材”。这些描述用语的组成有一定的排列规律。

通常来说会有以下几个部分：

影片微类型=地区+形容词+影片类型+创作来源+设定时间+故事情节+内容+适宜观看人群

还有一些不好归类的描述词，比如“大众口味”、“女性主导”、“绝望的爱情”，以及一些重量级的主演或者导演，但数量较少。所有76,897种微类型都是基于以上组合公式构成。

其次，根据统计结果，还得出了Netflix最受欢迎的形容词、最常见的时间设定和最常见的地点设定，这同样能够反映美国观众的观影口味。
向Netflix学习解构影片-凡影周刊NO.44-【一文】-

最后，将Netflix“微类型”数据库中的描述语进行排列组合，可以产生有趣的令人意想不到的结果。比如：
“以中东现实生活为背景的为儿童打造的深海父子情剧情片”
“欧洲小说改编的为8-10岁儿童打造的神秘社会里争夺名利相互暗杀的赏金猎人剧情片”
“关于友情的后世界末日时代喜剧片”
是不是让人脑洞大开？

紧接着，我们审慎些仅使用少量的形容词，就立刻发现了好莱坞影片制作的逻辑：一些相同主题的不断重组。比如：
“经典动作片”
“面向家庭的西部片”
这就是好莱坞！

3.来自Netflix的反馈

根据Netflix产品创新部副总裁Todd Yellin的反馈，上文中展现出的观察结果其实只是整个Netflix系统的最底层，一个终端产品而已。Netflix公司系统所分类和储存的数据与信息远远超出了上述内容。

Todd Yellin是这套系统的缔造者，是他提出了给每部电影贴标签的想法，并撰写了一份长达24页的提案来指导如何贴标签和创建系统。在2006年，Yellin与几位工程师通过数月努力，开发了一套名为“Netflix量子理论”的计划，其中“量子”指代每部影视剧中包含的核心元素，即现在所谓的“微标签”。

为了能够系统地将上千部影视剧拆解，同时保证所有的工作人员对这些“微标签”的理解是一致的，这份“Netflix量子理论”的文档阐述了如何标注影片结局、主角的社会接受度以及构成一部电影的其他各个方面，并且所有的标注都可以量化为1-5分的评分。比如说，每部影片都会得到一个“浪漫值”的评分，而不仅是贴上“浪漫电影”的标签；每部电影的结局都会从“喜”到“悲”逐级评估；包含每个情节、每次主角出现、每次地点转化在内的所有事件和角色都会被一一标注。这就构成了Netflix数据金字塔的根基。Netflix的工程师根据这些“微标签”创建了一套类型语法体系。这其中最关键的一步是：把人们对影片的主观认知（微标签）与机器算法（语法）进行有效结合。

这与Netflix过去的影片推荐系统有很大不同。之前的那套系统能够预估观众在观影结束后给影片打几分。他们还曾拿出100万美元悬赏，奖励能提高这套预估评分算法精确度的技术团队。经过几年时间的改进，准确度仅仅提升了10%。在不断摸索之后，Netflix认为，比起感性的影片得分，更具个性化风格的微类型细分，才是观众真正想要的。

除去了解用户的喜好，或为用户匹配相应的电影，Netflix的这个“微类型”数据库的意义还在于能更进一步地探讨和分析影片内容本身。当艺术性更加明显的电影碰上科学性更为显著的计算机技术，相信还会产生更多惊喜。

策划/文章：Zoe（微信zoecai0510 邮箱zcai.hk@gmail.com）
原文来源：http://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/

-----------------------------------------------------------------------------------------------------------
注：任何形式的转载请注明来源，以及原作者、译者、校对者的姓名，请尊重这些整理知识的努力。凡影周刊是由一支25人的翻译团队倾力维护的公众号，只为给中国电影行业的从业者带来更多更专业的全球市场信息。关注我们，收获的将是知识，而不仅仅是资讯。

本文为作者凡影周刊分享，影视工业网鼓励从业者分享原创内容，影视工业网不会对原创文章作任何编辑！如作者有特别标注，请按作者说明转载，如无说明，则转载此文章须经得作者同意，并请附上出处(影视工业网)及本页链接。原文链接 https://cinehello.com/stream/63910

凡影周刊

点击了解更多

凡影Weekly 是陪伴电影从业者和观察者的学习助手。我们每周梳理全球优质的文化产业知识，解读当下电影行业现象，希望能够协助优秀的您变得更好。关注我们，您收获的将是知识，而不仅仅是资讯。

扫码关注
凡影周刊

发表文章 180 篇

首页

学习

工作 | 工具

影视圈招聘

商城

发现

向Netflix学习解构影片-凡影周刊NO.44-【一文】-

凡影周刊

最近文章更多

关注影像创作与先进技术

关于我们

公司简介

使用条款

联系我们

内容合作计划

关注我们

首页

学习

工作 | 工具

影视圈招聘

商城

发现

向Netflix学习解构影片-凡影周刊NO.44-【一文】-

凡影周刊

最近文章 更多

关注影像创作与先进技术

关于我们

公司简介

使用条款

联系我们

内容合作计划

关注我们

最近文章更多