Netflix:用大数据创造热播美剧
2016-10-11 11:05
提起Netflix,国内观众首先想起的恐怕就是美剧《纸牌屋》。这家成立于1997年的美国网络流媒体服务商凭借高端自制美剧和突破性的排播冲击着传统电视平台的优势,不但2013年出品的《纸牌屋》引发全球性观看热潮,随后的《铁杉树丛》、《女子监狱》等多部剧集均保持超高质量,成为现象级话题。
和很多企业一样,Netflix也在追求准确预测观众喜好的能力,但从上述成绩可以看出,Netflix显然比它的同行更为成功。这得益于Netflix所拥有的基础平台和海量数据,正是对大数据的采集挖掘,使得Netflix能够准确把握观众喜好,进而生产出《纸牌屋》这样令人欲罢不能的美剧。
作为一家提供网络流媒体服务的公司,Netflix可以说将数据意识注入了自己的基因里。其数据平台架构经理Magnusson曾列举了Netflix数据理念的3条关键原则:
l 数据应该可采集,且易于为人们所发掘及处理
l 无论你的数据集是大还是小,要能够将其可视化并使其更易于解释
l 数据发掘所花时间越长,其价值变得越小
在这些原则之下,Netflix借助亚马逊云平台服务运行,自主开发数据工具,进而在数据采集、数据可视化方面进行努力,并以日益开放的姿态拥抱社区,从而不断提高其对用户群的把握能力。
一、 平台与工具
Netflix是全球最大的云计算用户之一,这家公司按小时租用亚马逊的服务器和存储设备,由亚马逊的云计算部门支持其计算能力。但Netflix不仅仅使用AWS(亚马逊网络服务)提供的数据管理能力,也建立了一系列复杂工具使其软件能够在亚马逊的云平台上运行良好。虽然这些技术很多都是专用的,但Netflix还是定制了大量开源软件支撑其业务的关键部分运作。
在云平台之上,Netflix创建了一些全球最强大的大数据工具,并不断开发出新的所需工具。比如,为了解决Apache Pig(大数据分析平台)原始代码理解困难的问题,Netflix开发了可视化工具Lipstick,使得建立和维护企业平台的人员能够直观查看哪些工作已经安装、用户能否看到他们想要的数据等问题,并及时发现观众的观影趋势。
二、 数据采集
对于Netflix来说,其最独特的做法就是采集数据。除了所看节目外,它还收集订户尽可能多的信息,主要包括以下几个方面:
l 通过地理定位数据,发现客户在哪里观看视频
l 它的客户通过什么终端在看视频
l 客户什么时候看视频——也即,星期几和具体时间
l 在有限范围内,档客户观看视频时正在做什么(Netflix跟踪客户每次看电影或电视节目的后退、快进和暂停行为)
但Netflix并不局限于自主采集。它也从诸如Nielsen等第三方购买元数据,从Facebook、Twitter及其他网站采集社交媒体数据。
在数据采集的过程中,Netflix还会考虑其他没那么明显的数据源。不久的将来,Netflix可能基于诸如电影声音甚至风景等元素来进行推荐。
三、 数据可视化
在Netflix数据驱动的环境中,数据可视化扮演着重要角色,这家公司以常规、持续而非临时、偶尔的方式使用着数据可视化工具。
在其企业博客中,Netflix将数据可视化视为最重要的元素,很多Netflix的主系统也都包含数据可视化这一重要元素。比如在客户洞察中,Netflix对受众构成进行色彩分析,通过彩色详细图解直观展示观众偏好,基于此再做出新剧开发、剧目推荐等大大小小的决策。
四、 拥抱社区
目前,Netflix已经允许Lipstick及其他一些开源解决方案面向所有互联网连接用户,供其免费下载。除发布开源项目外,Netflix还利用其API向外观察。也就是说,其他个人和公司可借助对API的访问扩展Netflix的核心产品,进行第三方开发。如果这些第三方特色很有用,Netflix也就可以模仿并在其主页和APP上加入这些功能。
简单而言,玩转数据的Netflix正在突破自有的数据池,以开放的姿态拥抱社区。而在那里,数据尚有更大能量等待着Netflix去释放。
从以上几个方面可以看出,Netflix虽然是一家网络视频公司,但其商业核心却是建立在大数据之上的。对数据的采集、挖掘和利用,正是Netflix制胜的关键。而对国内企业而言,了解和借鉴Netflix的经验也必将有所助益。
文章转自:www.cc-smart.com
和很多企业一样,Netflix也在追求准确预测观众喜好的能力,但从上述成绩可以看出,Netflix显然比它的同行更为成功。这得益于Netflix所拥有的基础平台和海量数据,正是对大数据的采集挖掘,使得Netflix能够准确把握观众喜好,进而生产出《纸牌屋》这样令人欲罢不能的美剧。
作为一家提供网络流媒体服务的公司,Netflix可以说将数据意识注入了自己的基因里。其数据平台架构经理Magnusson曾列举了Netflix数据理念的3条关键原则:
l 数据应该可采集,且易于为人们所发掘及处理
l 无论你的数据集是大还是小,要能够将其可视化并使其更易于解释
l 数据发掘所花时间越长,其价值变得越小
在这些原则之下,Netflix借助亚马逊云平台服务运行,自主开发数据工具,进而在数据采集、数据可视化方面进行努力,并以日益开放的姿态拥抱社区,从而不断提高其对用户群的把握能力。
一、 平台与工具
Netflix是全球最大的云计算用户之一,这家公司按小时租用亚马逊的服务器和存储设备,由亚马逊的云计算部门支持其计算能力。但Netflix不仅仅使用AWS(亚马逊网络服务)提供的数据管理能力,也建立了一系列复杂工具使其软件能够在亚马逊的云平台上运行良好。虽然这些技术很多都是专用的,但Netflix还是定制了大量开源软件支撑其业务的关键部分运作。
在云平台之上,Netflix创建了一些全球最强大的大数据工具,并不断开发出新的所需工具。比如,为了解决Apache Pig(大数据分析平台)原始代码理解困难的问题,Netflix开发了可视化工具Lipstick,使得建立和维护企业平台的人员能够直观查看哪些工作已经安装、用户能否看到他们想要的数据等问题,并及时发现观众的观影趋势。
二、 数据采集
对于Netflix来说,其最独特的做法就是采集数据。除了所看节目外,它还收集订户尽可能多的信息,主要包括以下几个方面:
l 通过地理定位数据,发现客户在哪里观看视频
l 它的客户通过什么终端在看视频
l 客户什么时候看视频——也即,星期几和具体时间
l 在有限范围内,档客户观看视频时正在做什么(Netflix跟踪客户每次看电影或电视节目的后退、快进和暂停行为)
但Netflix并不局限于自主采集。它也从诸如Nielsen等第三方购买元数据,从Facebook、Twitter及其他网站采集社交媒体数据。
在数据采集的过程中,Netflix还会考虑其他没那么明显的数据源。不久的将来,Netflix可能基于诸如电影声音甚至风景等元素来进行推荐。
三、 数据可视化
在Netflix数据驱动的环境中,数据可视化扮演着重要角色,这家公司以常规、持续而非临时、偶尔的方式使用着数据可视化工具。
在其企业博客中,Netflix将数据可视化视为最重要的元素,很多Netflix的主系统也都包含数据可视化这一重要元素。比如在客户洞察中,Netflix对受众构成进行色彩分析,通过彩色详细图解直观展示观众偏好,基于此再做出新剧开发、剧目推荐等大大小小的决策。
四、 拥抱社区
目前,Netflix已经允许Lipstick及其他一些开源解决方案面向所有互联网连接用户,供其免费下载。除发布开源项目外,Netflix还利用其API向外观察。也就是说,其他个人和公司可借助对API的访问扩展Netflix的核心产品,进行第三方开发。如果这些第三方特色很有用,Netflix也就可以模仿并在其主页和APP上加入这些功能。
简单而言,玩转数据的Netflix正在突破自有的数据池,以开放的姿态拥抱社区。而在那里,数据尚有更大能量等待着Netflix去释放。
从以上几个方面可以看出,Netflix虽然是一家网络视频公司,但其商业核心却是建立在大数据之上的。对数据的采集、挖掘和利用,正是Netflix制胜的关键。而对国内企业而言,了解和借鉴Netflix的经验也必将有所助益。
文章转自:www.cc-smart.com
本文为作者 北京新传智库科技有限公司 分享,影视工业网鼓励从业者分享原创内容,影视工业网不会对原创文章作任何编辑!如作者有特别标注,请按作者说明转载,如无说明,则转载此文章须经得作者同意,并请附上出处(影视工业网)及本页链接。原文链接 https://cinehello.com/stream/83508
北京新传智库科技有限公司
点击了解更多
北京新传智库科技有限公司(北京新传智库风险研究院)简称新传智库,专注于影视行业全产业链风险评估和风险管控,为投资、制片、宣发、院线、版权经营等公司主体提供影视项目的风险雷达扫描、票房预估、受众调研等专业化订制服务。
研究院的核心产品包括影视项目的前期、中期、映期、映后风险评控,风险规避方案、票房预测等,并能够为相关企业的市场洞察、项目投资、IP孵化、营销发行、影院经营等提供决策支持。
扫码关注
北京新传智库科技有限公司
北京新传智库科技有限公司