给我留言 | 加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
| 全民阅读 | 推荐影音 | 推荐站点 | 网站导航 | 基金奖项 | 智囊智库 | 赛事集锦 | 为/问什么呢 | 太有才啦 | 献言/呼吁/告诫 |
您当前的位置:首页 > 精彩推荐 > 为/问什么呢

Netflix公司如何逆向解构好莱坞电影?

时间:2014-03-06 11:35:03  来源:  作者:

 

负责人兼译者:ArielXiong
如果使用Netflix,你可能惊奇于它给你推荐给你的特别类型,因为有些推荐类别甚至让人觉得很特殊、很荒谬。比如情感斗争类的纪录片、基于现实生活的古装剧、20世纪80年代的外国魔鬼故事…
如果Netflix要为4000万用户推荐特定的电影,那么它将用多大的“个性化类型”(personalized genres)数据库去描述整个好莱坞的电影呢?当我意识到我有可能发现Netflix算法如何产生“微类型”的规律后,原本只是想想而已的事情竟让我狂热地着迷。
通过大量而且重复工作,我们发现Netflix不仅仅进行了几百个或者千个的类型分类而是有76,897种独的电影分类方法。
用我的程序进行加载、复制、粘贴这些简单的脚本花了20多个小
我们花数个星期来理解,分析,反向解析Netflix的词汇和语法的分类原理。我们已经拆分了Netflix最受欢迎的分类,计算最受欢迎的演员和导演。
据我所知以及Netflix表明,没有公司像Netflix整合过这些数据。从数据中可以得知:Netflix分析非常细致,给每一部电影和电视剧都会设定标签他们几乎拥有所有好莱坞的影片,而那些我们找到的流派仅仅是整个数据库的冰山一角。
Netflix公司内部把这种分类过程称之为“altgenres ”。为了让我明白名字的由来,Netflix公司同意让副总裁托德·耶林(ToddYellin(”altgenres”的设计者)接受我们的采访。这是一个特殊的解析电影的过程,整个”altgenres”系统复杂精确。佐治亚理工(Georgia Tech)的教授兼《大西洋月刊》(The Atlantic)的特约编辑伊恩·博格斯特(Ian Bogost)和我一起重建了Netflix的语法。伊恩还编写了那个神奇的类型生成器的程序。
我们逆向解构耶林的系统原理,发现真的难以超越。他们雇佣了很多人,阅读长达36页的培训文档,然后训练他们如何对影片的性暗示内容、暴力程度、浪漫桥段、甚至情节等等元素,做出精确地评级、细分。
他们捕捉了数万种不同的电影属性,甚至是给人物的道德评级。这些标签,与千万级用户的观影的习惯相匹配,便成了Netflix的竞争优势。Netflix的主要目标,是为了获得并留住订阅用户。这些匹配不同的观众的“微类型”正是他们战略的重要部分。在2012年的时候,Netflix就在其官方博客(Blog)中提到,“了解用户喜欢的’微类型’的内容,就能用高收视的类型取代低收视的部分,以赢得竞争力。”只要,Netflix更了解用户,用户就越容易黏在它的平台上。
现在Netflix在制作内容上有着极强的优势:建立了属于自己的用户对美国电影喜好的数据库。这个数据库,虽然不能告诉导演编剧影视剧要怎么拍,但他能告诉这些人,影视剧中需要什么样的元素。比如他们拍摄《纸牌屋》的时候,就该知道哪些元素需要有的放矢。
收集数据的行动
这开始于我想全面了解Netflix的“微类型”。这似乎是个有趣的故事,由于之前有很多人都列过所有Netflix的”微类型”,因此需要我们有一些新鲜的想法。
我从请求我Twitter[[2]]上的粉丝提交一些分类类型(categories)到一个共享文件里开始的。“据我所知,虽然还没有这样的清单,但是显然我们应该设计出比较完整的类型清单”,我写到,“现在,我们就能知道Netflix究竟是怎样为我们服务的。”最终一共获得150个类型,比RIP[[3]]普通用户数量多很多。
但是在那时,作家兼工程师莎拉·帕维斯(Sarah Pavis)提出,不同的Netflix的类型网址(URL[[4]])是按序编号的。只要简单的改变网址后面的数字,就可以获得更多的类型。比如,http://movies.netflix.com/WiAltGenre?agid=1链接到非洲裔美国人犯罪纪录片。http://movies.netflix.com/WiAltGenre?agid=2链接到20世纪80年代恐怖的宗教片。以此类推。
通过十几个网址的对比后,我开始尝试任意大的数字。1000(类型编号)——奥托•普雷明格(Otto Preminger)导演的电影。3000——史泰龙(Sylvester Stallone)主演的的电视剧。5000——20世纪40年代广受好评的犯罪题材电影。20000——20世纪70年代的母子亲情电影。虽然我获得的数据库中仍然有很多空白,但是目前也已增加到90000多个类型了。
对我已有的数据深入分析可知三件事:第一,Netflix有一个惊人的类型库,比我预想的要多两个数量级;第二,电影分类类型的组成方式很复杂;第三,手动浏览所有的类型几乎不可能。
但是我也意识到一定有可以获得所有数据的方法。我现在使用的一个昂贵的软件UBot Studio[[5]]可以编写网页上自动化脚本,而低级垃圾邮件和诈骗邮件就使用这个软件写出来的,但是我决定用它来加速浏览Netflix的每个”微类型”,并将它们复制到一个文件中。
在排除故障后以及伊恩·博格斯特的帮助下,UBot Studio开始运行起来了,简单的复制粘贴一个个网址,基本上是重复性的人工劳动。在厨房角落,我们用华硕(Asus)笔记本运行了一整天后,终于搜集到了所有数据。
软件运行过程中,我开始熟悉数据。从中随机挑出一小部分,大家就可以看到原始资料的是怎样的:20世纪30年代感人的独立体育类电影,间谍历险片,有关邪恶小孩的小众恐怖电影,小众体育电影;20世纪70年代伤感欧洲戏剧,视觉效果震撼的异域怀旧戏剧,日本体育电影,探索频道纪实节目,中国浪漫爱情犯罪电影;20世纪80年代离奇古怪的小众恐怖电影,黑暗悬疑科幻恐怖电影,西方悬疑复仇电影;20世纪80年代暴力悬疑动作电影及历险片,由威廉·哈特内尔(William Hartnell)主演的穿越电影,印度浪漫犯罪电影,有关邪恶小孩的恐怖电影,特效动作历险电影;20世纪60年代讲述英国的欧洲科幻电影,黑暗悬疑帮派戏剧,广受好评的情感失败者的电影。
一开始,我发现并不是每个流派后都附有一连串电影。因为流媒体更新速度很快,我所看到的是可以概括几乎所有不同风格电影的描述词,而非在特定时间和地点(美国)出现的某个电影角色。因此,91300(类型编号)——浪漫 的西班牙电视剧,不能让我得到任何有用信息。相反,91307——具有视觉冲击力的拉美喜剧后面附有两部电影;6307——具有视觉冲击力的浪漫 戏剧附有20部电影。
浏览过程中很重要的一点是要牢记Netflix数据库中的每一种“微类型”与其电影数量并非精确对应。这些”微类型”的存在基于一定的算法(一些电影正好符合这一说法,待会儿会进一步讨论)。
继续浏览更多的文本信息,我还发现其它规律。Netflix有自己的术语。同样的形容词不断重复出现,影片来源地和数量惊人的名词性形容词(如“西部片”和“杀人犯”)就会不断重复出现。数据库中介绍电影创作灵感(基于现实或文学作品)、时代设置(如爱德华时代)的方法多种多样。此外,还会标注故事发生的不同时间段和适合观看儿童的年龄,例如:20世纪80年代、适合8至10岁的孩子观看等等。
最有趣的是,这些不同的名词从不同侧面完整体现美国精神,如:
Netflix搜索的最多的是婚姻(Marriage)

随着时间的推移,Netflix语法——用只言片语组成可理解的文本的方法——也已变得清晰可见。
如果一部电影以浪漫主义为题材并获得奥斯卡奖,那么“获奥斯卡奖”总是被放在文字的左边:获奥斯卡奖的浪漫主义戏剧。形容时间的定语总是放在全部定语的最后一个:获得奥斯卡的浪漫主义电影——来自20世纪50年代。单个的形容词可直接堆积,但至少切入一个重点:获奥斯卡奖的浪漫主义戏剧,不伦之恋。电影内容类别通常置后:获奥斯卡奖的浪漫主义戏剧——关于婚姻。
事实上,每一类描述词都有规律可循。一般说来,主要有以下几个部分:
影片类型=地区+形容词元素+影片类型+创作背景+拍摄地点+时间+故事情节+适宜观看人群
当然,也有一些万能描述词。例如大家最喜欢的“铁腕女性领导”,“绝望的爱情故事”。以及一些重量级的主演或者导演的电影电视剧。
但那些只是少数。最终UBot Studio摘录的76897个”微类型”都是由基本的描述词组成。但我仍不能理解这些被创造出来的逻辑关系和词汇是如何做到通俗易懂的。我的脑子里全都是Nefilx系统,却没有丝毫眉目。
我应该意识到UBot对Netflix的成功分析让我忘乎所以。少量类别组合在一起已经非常有趣,如果我们进行76897种类别的组合呢?
因此我的同事伊恩·博格斯特建议制作“类型生成器”。
破解Netflix的文法】
为了建立类型生成器,而且需要精确地理解文法,我们开始使用另一款软件——AntConc[[6]]。其用户通常是语言学家、数位人文学者以及处理文献和大量文本的图书管理员。如果你使用过Google NgramViewer[[7]],那么你应该至少知道AntConc的一个功能。
AntConc的功能基本上是将一堆文本变成可操作的数据。例如,它可以统计在组成Netflix数据库的海量文本中每个词汇出现的次数。
因此,统计出前十位,Netflix常用描述电影的“个性化类型”,就非常容易了。
前十位的常用词依次为:浪漫的(Romantic),经典的(Classic),黑暗的(Dark),广受好评的(Critically Acclaimed),悬疑的(Suspenseful),坚忍不拔的(Gritty),独立的(Independent), 视觉冲击的(Visually Striking),暴力的(Violent),感觉良好的(Feel-good)
或者你还可以让该软件统计所有以“起始于”开头的三字短语,输出的是Netflix影片类型里面最受欢迎的几个年代,其中,20世纪80年代理所当然地成为排名第一的影片年代。因此,当你搜索“80年代”电影,则会省事不少。
Netflix最热搜索年代是20世纪80年代(The 1980s)。
搜索以“摄制于”开头的短语,就得到了类型名称中提到的所有地点。
Netflix最热搜索地点为摄制于欧洲(Set in Europe)。
搜索以“针对”开头的短语,就得到了一个按年龄划分的类型描述列表。Netflix通常有“儿童类”影片,而且针对年龄在0到2岁、0到4岁、2到4岁、5到7岁、8到10岁、8到12岁以及11到12岁的观众。
我收集了Netflix所有词汇数据并创建了一份庞大的电子数据表。我单独统计了排名靠前的演员、导演和创作者的名单,并存储到另一文件中。
之后,伊恩采用这些数据表,并创立了几套不同的文法。第一种文法,也是最简易的方法,就是堆叠大量的形容词,并不断加入其它描述词。这就是“类型生成器“中的“GONZO”设置。它会输出一些惊人的内容,让你立刻想要复制并粘贴给朋友,例如:以中东地区现实生活为背景,有深海和父子等相关情节的历史儿童片。取材于欧洲传奇类书籍,讲述秘密暗杀组织的剧情片,适合8到10岁的观众。以友谊为主题的后启示录喜剧。
天呐!这太棒了,不是吗?再次读到它时,你难道不希望真有这样的电影存在?难道不会对之浮想联翩?总而言之,”GONZO”对于我来说,就是应该存在,但却不会出现的电影,或者至少可以定位成“应该存在“,”可能很快出现”的电影。
然后,我们相应缩减有趣的部分,只允许标题中出现少量形容词,就可以发现好莱坞电影制作的逻辑,基本上就是:几种相同主题的不断重组。如,经典动作片,适合家庭观赏的西部片,巴迪时期历史片
这就是好莱坞的精髓!(这就是好莱坞!)
最后,我们不断改变文法结构,终于发现了Netflix这种分类系统的独特性。如,粗俗可笑的惊悚片,融合了体制对抗、政治元素和三角恋情的悬疑片,涉及皇室题材的冷峻动作片。
当我们在研究”类型生成器”时,我能猜出以前肯定也有人用同样的分析方法分析过。有某个人做过和我们相同的抉择。使用多少个形容词?形容词应该有多长?甚至是更基本肯定的问题:应该有哪些形容词?为什么选用“理性”而不是“机智”?为什么要对“血腥”和“暴力”加以区分?
身为作家,我一直在问自己:为什么Netflix类型的这些形容词总是那么“恰如其分”?“稀奇古怪”、“打斗类”(比如《柯南》)以及“曲折离奇的故事”、“警匪”、“疯狂科学家”、“失败者”、“轻松愉快”和“朴实含蓄”。
是谁对这些描述词进行过细致的筛选呢?
我们也仍然心存疑问。从《洛杉矶时报》的一篇文章中,我们学到了设置标签的基本知识 。但是这些标签是如何与Netflix的“个性化类型”结合的呢?是什么样的算法能将标签精确地转化为76,897个类型
如果大部分人像盲人摸象般,理解Netflix的影片类型,就只能够看到部分的大象,而看不到事情的整体。我感觉我也是这样,所以我需要有人能向我描述它的其他部分。
因此,拿到数据后,我打电话给Netflix公关联络人员,想要谈谈。这是一个叫约里斯·艾弗斯(Joris Evers)的荷兰人,他的桌子上摆着一个微型风车模型。
我将工作进展向他和盘托出后,不知道自己在Netflix的账户是否会被注销,等着听他的回应, 他却说:“我想你是过来找托德·耶林的吧!”
托德·耶林是Netflix的产品副总裁,负责Netflix的系统创建。给所有影片添加标签原本就是他的想法。最初就如何给影片添加标签,他亲自撰写了一份24页的文件,并给公司初期的影片加上了标签,还指导了整个系统的创建 。
是的,我当然想拜会一下耶林。我觉得创造这个系统的人(指耶林)好像是《绿野仙踪》里的魔法师,而我一直在通过对数据的梳理,来试图理解他在其中展现的聪明才智。
在我采访他时,耶林对我说道:“好多年了,我一直在等像你这样的人出现。”
Netflix位于加州洛斯盖多斯的一个少为人知的硅谷小镇上。那里有一座回收中心,燃烧喷出的毒素遍及整个旧金山湾区。我访问Netflix公司的那天,天空的颜色变得很奇怪,鼻子里能闻到一股塑料燃烧的怪味。
Netflix大楼是一幢意大利风格的建筑,看起来像是由温泉疗养院改建的:黄色的外墙、喷泉、连廊桥。总部后面是人们居住的公寓,居民与Netflix公司员工共用一家健身房。
那感觉十分奇怪,像是电影场景,只是人们做的事情全都不对;就像是你出现在环球影城的外景地,而结果发现是在嘉信理财的分公司一样。人们应该徜徉在泳池边,吃着橄榄,喝着玫瑰酒,但实际上却坐在整排的小隔间里打字。
耶林的身上也给人那种感觉——一种与周围格格不入的好莱坞式做派。他机智,敏捷,有活力,让人觉得他像是一个制片人。这也不足为怪,因为据他本人所述,他曾经“涉足过电影业的各个方面”。实际上,他非常像演员麦克·凯里(Michael Kelly),后者在Netflix原创剧集《纸牌屋》里扮演弗兰克·安德伍德(凯文·史派西Kevin Spacey饰)的办公室主任道格·斯坦普。
他像是那种很有办事能力的人。
和他在一间会议室里坐下后,我抽出自己的电脑,开始展示我们做好的“类型生成器”。我向他详细讲解了自己的电子数据表,展示了我们完成的所有文本分析。
尽管我们的一板一眼让他印象深刻,但是他还是耐心解释,其实我们仅仅看到了整个Netflix数据基础架构的一个终端产品,而公司系统所存储的数据和信息远远超出我们所获取的内容。
关于怎样组合各部分(这里指“微类型”中描述词的组合),他对我这样说,
我的首要任务:拆分内容!”
那么,耶林是如何系统地对数以千计的电影分类,并且要让不同的分类工作者对“微标签”(micro-tags)的影片有着相同的理解呢?
在2006年,耶林带领一群工程师,历经数月,终于开发出了一整套类型源。耶林自嘲地给它起了一个自负的名字“Netflix量子论”。这个名字意指,能构成每部电影类型的小小“能量包”。耶林曾把它叫做“量子论”,而现在常称作“微标签
“Netflix量子论”文件针对影片结局、主角的人气以及构成一部电影的其他各个方面,详细指出了多种设置标签的方法。每个标签都可以量化,也就是说,它们将有五个等级。例如,每部电影除了在个性化分类中加上“爱情片”的类型,都有一个浪漫评级。每部电影的结局都会从喜到悲逐级评估,包括模棱两可的部分。每个情节、主角的工作、电影场景都会一一标注。巨细靡遗,无所不包。这些数据都好比金字塔的基础。而创造这些覆盖所有影片的类型让耶林感觉很头疼的事。Netflix的工程师们采用了这些类型并为影片类型创立了一套类型语法,其中许多类型都可以在我们的类型成器中批量生成。
就我看来,其中关键的一步是:将设置标签的人类智慧与有着运算法则的机器智能相结合。不难看出,Netflix公司”个性化类型“完全是人为形成的,也从侧面反映出人类可能还不能独立解决这一问题。例如,形容词“感觉很好”,要想给电影贴上这样的标签,电影必须满足一系列特征以外,更重要的是有一个美满的结局。工程师在给一部电影分类时,依据的是一系列基本的标签,并不是直接得到这个电影的类型。
我能想到的是,与Netflix公司的分类系统比较相似的是潘多拉网络电台的一度被推崇的“音乐基因工程(Music Genome Project)”[[8]]的程序。但是Netflix分类系统的突出特色是对电影的不同描述。Netflix不仅能够展示给你事物可能的样子,而且告诉你事物的类型。这就是一种用其特有荒诞的方式内省的工具。
Netflix公司推荐的不仅仅是你喜欢的电影,还能告诉你电影之间的不同。推荐系统是一个神奇的窥视人类内心的系统。这也需要你与过去Netflix公司电影推荐的方式区分开来。该公司曾经鼓吹能够在一定程度上预测用户会给一部电影评多少颗星。因此,该公司鼓励用户不断给电影评分,这样就能够利用这些评分为用户推荐最合适他们的电影。
Netflix公司甚至拿出100万美元的奖金,用于鼓励团队设计出算法。要求其算法能够提高公司预测用户给电影评星的能力。而团队花费数年时间也仅仅把算法提高10%
尽管该奖金在2009年开始设立,但Netflix并没有把它纳入新模式,而只是一种工作需要。他们认为,比起感性的得分,更个性化风格的”微类型”细分,才是观众真正要的。采用人类语言进行分类,有助于人们理解推荐内容。“如果你拥有工程师的敏感,那么预测影片达到3.2星是一个非常有意思的事情,但在预测家庭矛盾和疾病瘟疫方面,它应该发挥更多的作用。我们希望提供更多语言版本,”耶林说。“我们希望突出我们的个性化,因为我们对准确推送影片类型非常自豪。”没有什么能比为用户提供一个细而又细的子分类更能体现他们得到的个性化服务了。
那么,为什么不能把分类的类型做得超级精细呢?也就是说,超级长,就像我们采用生成器设置“GONZO”那样分类呢?
耶林表示主要有三个因素限制了这样的分类:1、公司的UI[[9]]界面上仅仅只能显示50个字符,更多的类型无法展示。2、至少在Netflix公司的DVD扩展编目上,必须有一个适合类型描述的内容“临界点”。3、Netflix公司只需要符合语法意义的类型。
而我们的“类型生成器”之所以如此有趣,正因为我们摒弃了所有这些限制条件。
Netflix线下销售中,没有一部电影的标签超过五个,有四个标签的电影都为数不多。但是它向用户展示出来的电影,如拍摄于二十世纪七十年代的疯狂科学家的恐怖仪式。三个描述词的比较多:如恋爱无果的国外轻松喜剧片,两个描述词的最常用:有咸湿情节的智力游戏片。当然用的最多的一个词是:离奇的电影。
耶林那里,我还了解到一个有意思的事情。基础标签数据不仅能够创立分类,还能提高为用户展示所有影片时的个性化水平。因此,如果Netflix公司发现你偏爱冒险动作片,且里面含有很多浪漫的戏份(通常有五个等级)。系统可能会推送这一类电影,但电影上不会有“浪漫冒险动作片”的标记。“我们通过分类能知道电影的浪漫程度,但是我们并不会告诉你有多浪漫,只是我们会推送给你。”耶林说。“你会得到一个动态的推荐列表,其中或多或少都有一点浪漫的成分。这些是基于我们知道你偏爱的浪漫的结果。”
耶林描述的内容,让我突然感到Netflix公司创建的系统在科技领域有一个类似的对象:Facebook的“新闻收集系统”。 只不过,Netflix向你提供的不是计算机认为你会感兴趣的网页内容,而是电影娱乐内容。
人机智能混合技术因此更加令人感到惊奇。如果纯粹使用计算方式,例如注意拥有相似观影习惯的人们并基于他们的观看历史推荐影片。(Netflix也的确在使用此类数据)。但是该技术关注内容本身,更先进。
这是一种真正的融合,”耶林说,“它将机器学习算法、算法规则和一群热爱这些的极客(Geeks)[[10]]们结合起来。”
试想:如果Facebook[[11]]依照一份36页的标签文件对个人网站进行拆解,它能真正理解人们喜欢《大西洋月刊》(The Atlantic)[12]、《科技新时代》(Popular Science)[13]、4chan网站[14]或ViralNova网站[15]的原因吗?
如果仅仅分析网页内容,是不可能做到的。但是Netflix的系统做到了。
采访结束后,我拿出电脑,给耶林看最后这张表(见下表)。仔细研究一下,就会发现一些特别之处
在最受欢迎的好莱坞影星中,雷蒙德·布尔(Raymond Burr)位居榜首,他曾出演过20世纪50年代的电视剧《梅森探案集》(The Perry Mason Mystery)。而在第七名的位置,我们看到了布尔在剧中的对手,芭芭拉·黑尔(Barbara Hale)。
为什么黑尔和布尔的排名可以超过梅丽尔·斯特里普和多丽丝·黛,更不用说像塞缪尔·杰克逊,尼古拉斯凯奇,弗雷德·阿斯泰尔,肖恩·康纳利,以及其它几位排名靠前的明星。
雷蒙德·布尔            布鲁斯·威利斯        乔治·卡林         
                            成龙                   刘德华          
罗伯特·德尼罗         芭芭拉·黑尔         克林特·伊斯特伍德   
金·奥崔                  周润发                 安东尼·霍普金斯  
鲍勃·霍普               加里·格兰特         猫王   
弗雷德·阿斯泰尔      约翰·韦恩            迈克尔·凯恩      
 罗伊·罗杰斯           肖恩·康纳利          伯特·雷诺兹          
查尔斯·布朗森        杜夫·朗格            哈里森·福特           
约翰·库萨克           肯·沙姆罗克          兰斯·亨利克森       
梅丽尔·斯特里普     尼古拉斯·凯奇       鲁格·豪尔            
缪尔·杰克逊           史蒂芬·席格          席尔维斯特·史泰龙   
汤姆·李·琼斯         方·基默                安德森·席尔瓦          
巴斯特·基顿           埃里克·罗伯茨       弗雷德·威廉森    
尚格·云顿             迈克尔·马德森        米基·洛克       
昆顿·杰克逊          罗伯特·米彻姆       斯迈里·伯内特    
汤姆·贝伦杰          韦斯利·斯奈普斯
这个列表可不是胡乱拼凑额。我们可以简单说,Netflix基于演员的分类类型没有意义。但事实并非如此,其他排名靠前的演员有很多作用,即使没有准确的反应他们的票房影响力。
让我们再看看排名前15位的导演名单。你也许没听说过小克里斯蒂安·尼比二世(Christian I. Nyby II)这个名字,但他曾在20世纪80年代执导了好几部电视电影版的《梅森探案集》。(他的父亲克里斯蒂安·尼比也曾担任《梅森探案集》原创剧集的导演)。
克里斯蒂安·尼比二世     曼尼·罗德里格斯
三池崇史                    伍迪·艾伦
恩斯特·刘别谦             吉姆·温诺斯基
吴宇森                      瑟夫·凯恩
诺曼·陶罗格              彼得·杰克逊
黑泽明                     英格玛·伯格曼
斯普林斯汀               雷德利·斯科特
罗杰·科尔曼
令人奇怪的是,除了《梅森探案集》的导演,这个列表都十分合理。
但是,雷蒙德·布尔和芭芭拉·黑尔的出现并不意味着他们的电影总会被推荐给Netflix的用户。用户们更可能得到布鲁斯·威利斯(Bruce Willis)主演的动作电影。
那么,为什么Netflix要创建这么多分类呢?
雷蒙德·布尔出演的悬疑片
雷蒙德·布尔出演的电影
雷蒙德·布尔演的戏剧
雷蒙德·布尔演的恐怖片
雷蒙德·布尔演的悬疑电影
雷蒙德·布尔演的悬疑戏剧
雷蒙德·布尔演的理性恐怖片
雷蒙德·布尔演的理性戏剧
雷蒙德·布尔演的理性悬疑戏剧
雷蒙德·布尔演的理性神秘电影
雷蒙德·布尔演的理性悬疑电影
雷蒙德·布尔演的理性电影
雷蒙德·布尔演的谋杀神秘电影
雷蒙德•布尔出演的低调的电影
雷蒙德•布尔出演的低调的悬疑戏剧
雷蒙德•布尔出演的低调的悬疑电影
雷蒙德•布尔出演的低调的神秘电影
雷蒙德•布尔出演的低调的恐怖片
雷蒙德•布尔出演的低调的戏剧
我问耶林,这是怎么回事?
事实上,我先告诉他我的理解:“在DVD时代,《梅森探案集》的粉丝们下了大量的订单。因为如此充足的需求,促使你们划分这些类型。”
但是耶林说,这种理解不太准确,他们的系统并不是这样工作的。
另一方面,没有人可以解释为什么会有这么多关于雷蒙德·布尔和芭芭拉·黑尔的子分类出现。即便是耶林本人,也没法说清楚。这超出了人类逻辑的范围。存在也是一种合理。
我试着给这种梅森现象命名:鬼魂、小精灵、小故障。究竟该如何称呼这种因代码和信息交叉而产生的微分类呢?
令人恼火但又印象深刻的结论就是,当公司把人类智慧与机器智能结合之后,有些令人无法理解的事情就会发生。
让我冷静一下。在人类的世界里,生活因为意外而精彩。”耶林告诉我。“你让机器世界变得越复杂,超出想象的意外事件就会越多。梅森探案集的故事还会继续。这样的鬼魂将一直是复杂机器的副产品。它可以被看做故障,但有时也是种特色。”
《梅森探案集》以揭露真相闻名。审判中决定性的时刻就是梅森发现案件中最关键的证据,而把所有线索联系起来,大获全胜之时。
如今,现实世界被编码成机器接受的数据,然后再解码成人们能够理解的描述。在这个过程中,人们的理解能力变弱了。当我们寻找答案,探究原因时,我们再难像梅森那样地揭开谜团。因为这些问题可能并没有答案。
Netflix解答了我们的疑问,告诉我们接下该看些什么,但因此又产生了它自身的小问题。
它可以被看做故障,但有时也被称之为特色。

 
[1] 亚历克西斯·马德里加利(Alexis Madrigal)是《大西洋月刊》(The Atlantic)的资深编辑,主要负责科技频道(the Technology Channel)。
[2] Twitter是国外的一个社交网络网站,是全球互联网上访问量最大的十个网站之一。
[3] RIP指Routing information Protocol,是应用较早、使用较普遍的内部网关协议。
[4] URL(Uniform/Universal Resource Locator的缩写,统一资源定位符)也被称为网页地址,是因特网上标准的资源的地址(Address)。
[5] UBot Studio 可以阅读网页的数据或者你储存的文档,处理复杂的数据操作,提供简单的列表和表格。
[6] AntConc是一款语料库的检索工具。用户首先获得语料库,再利用它来检索。
[7] Google Ngram Viewer是谷歌(Google)公司旗下的软件。它囊括了全球一千五百万本藏书的字汇,在它上面输入词汇,可以显示图表观察该词汇在不同年代书籍中出现的频率。
[8] 音乐基因工程,是潘多拉创始人提姆.威斯特伦(Tim Westergren)设计的程序,可以给消费者提供最有可能符合自己口味的音乐。
[9] UI即User Interface(用户界面)。
[10] 极客,是英文单词geek的音译,指智力超群,善于钻研但不爱社交的学者或知识分子。
[11] Facebook是一个在线社交网络服务网站。
[12] 《大西洋月刊》(The Atlantic)现在是一个普通的社论杂志。把目光集中在外交、政治、经济、文化趋势等方面,主要是针对“思想领导者”的目标受众。
[13] 《科技新时代》(Popular Science)是创建于1872年的美国月刊杂志,主要包含科技方面的文章。其读者大多数具有高等学历,其中80%以上为男性。
[14]  4chan是于2003年推出的一个仿双叶频道(2chan)风格、以ACG相关讨论为主题的美国贴图讨论版网站,原为分享图片和讨论日本动漫文化而建。
[15]  ViralNova网站定位为分享世界各地有趣,有爱,有价值的故事。
更多协作,欢迎关注译言协作翻译大本营小组,协作q群 153822117(已满)/ 262463682。
版权声明:
本译文仅用于学习和交流目的。非商业转载请注明译者、出处,并保留文章在译言的完整链接。
来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
相关文章
栏目更新
栏目热门