没有人能够猜透 Facebook 的算法究竟是如何生成的,而内部人员更不可能告诉你这些。这个自动化的算法对于人们的社交有着重大的影响,而且它决定了我们每天会看到什么,要知道世界上有五分之一的人口——近 10 亿的 Facebook 活跃用户每天就在动态消息里面阅读新闻。
病毒式扩散的算法机制完全颠覆了传统的媒体,把新兴的创业公司 BuzzFeed 和 Vox 市值推上了高位,而拥有一百年历史的报纸们则被陆续带进了坟墓。
社交游戏公司 Zynga 和团购网站 LivingSocial 凭借 Facebook ,在短短一两年的时间内就做到了数十亿美金的估值,投资者们赚得盆满钵满。Facebook 的动态消息甚至能够左右我们的喜怒哀乐,它推送给我们真正优质有趣的消息,并将仅仅是情绪性的表达筛选掉。
然而, 尽管它拥有如此的权力,它的动态消息却一直难以让人满意,推送的内容十分随意,变幻莫测,有时候甚至出奇的不雅。经常会推送一些无关紧要的东西,谣言,琐事,充满戾气的话,或者是无趣的消息。Facebook 的内部人员很清楚这件事。在过去的几个月内,这个社交网络巨头开始将重新设计过的动态消息推送算法在用户内进行小范围的测试,你猜结果如何?
用户们普遍反馈「有时」,新的动态消息会击中他们的兴奋点。Facebook 对此表示欣慰,并强调会进行持续性的改进。
「有时」代表着你离完全的成功还有很长的路要走。
近年来,Facebook 和其他硅谷巨头们越来越习惯于用机器学习软件替我们做出选择。硅谷明星埃隆马斯克和著名科学家霍金都曾经提出警惕人工智能的观点,而「算法」这个词本身,就是为了大幅提高效率而生的。「算法」对于普通人来说,是「不明觉厉」的计算机名词,神秘而充满魔性,而 Facebook 等科技巨头使用的算法更是令人好奇。
最近,我参观了 Facebook 总部,与动态消息的算法团队相处,了解这套机制背后的故事。他们是如何把臭名昭著的动态消息算法扭转口碑的,为什么要这么做,如何做到,及背后的运行机理。此外,我们还能了解到很多关于算法局限性的问题,数据有时候也会撒谎,Facebook 为此专门请了外包团队进行人肉反馈,以达到更准确的效果。
Facebook 的算法,据我所知,有点小瑕疵并非系统的缘故。以现在的科技水平而言,算法想要达到科幻小说一般洞悉人性是不可能的。Facebook 算法的背后还是人。工程师们决定了数据的筛选,加工,及输出。
算法出错,背锅的当然是设计算法的工程师。算法的一步步进化,也是无数工程师们看了无数的数据,开了无数会议,反复测试,最终的结果。然而,Facebook 算法的持续进步仍然使人感到好奇,他们是如何做到的?
当我到达 Facebook 总部时,一名 37 岁的大男孩接待了我,他脸上挂着善意微笑,充沛的精力及旺盛的表达欲望是他最明显的特征。他就是 Tom Alison ,「动态消息」算法的工程主管,他管理着设计算法的工程师们。
Alison 带着我穿过迷宫般的 Facebook 办公区,穿过一个小厨房之后,我们进入了一件小型会议室里。Alison 向我承诺会把 Facebook 算法背后的原理讲清楚,即使对于我这种外行来说。
到了以后,我想去一趟洗手间,我问了他应该怎么走。他很抱歉的对我说,「还是我带你去吧」。起初我以为他是怕我迷路,当我从洗手间出来时,发现他就站在门口等着我。我不禁认为,他被上级要求不能让我在办公室里单独走动。
Facebook 总部
同样,Facebook 对于他们的商务信息守口如瓶,Alison 不能告诉我有关「动态消息」 算法的实际代码。然而,他能告诉我大概的原理,以及为什么它一直在改变。工程师们通常喜欢站在白板前讲解,他也不例外。
这些转变有部分原因是为了起到防御作用。近年来,Facebook 在社交网络的统治地位屡遭威胁,正如当年 MySpace 的地位遭到 Facebook 的挑战一样。
而新兴的创业公司完全避开了数据驱动的模式,以 Instagram 为例,他们直接把你关注的所有人的状态消息以反时间顺序的时间线列出,Facebook 不得不买下 Instagram 以维持老大哥地位。Sanpchat 则以独特的阅后即焚模式侵蚀着 Facebook 的青少年市场。
Facebook 并不是近年来唯一数据驱动优化推荐算法的公司。Neflix 的最佳影片推荐,同样更具海量的用户数据,给用户分成无数小类,分类推荐。为了平衡亚马逊的自动 A/B 测试,首席执行官贝索斯一直设立一个单独的反馈邮箱供用户提出意见。
现在将数据的处理完全交给机器学习还为时尚早,但机器学习的时代正在加速到来。Facebook 主管 Mosseri 在开会时并不喜欢使用时髦的“数据驱动”,他说的是「数据辅助」。
Facebook 动态消息排序小组相信他们的努力终将得到回报。「如果我们继续根据反馈提升动态消息推送,我们呈现的消息就回越来越接近人们心中所想。」负责与动态消息反馈小组对接的用户体验分析师 Scissors 说。
这里有一个潜在的负面影响:给用户控制的权利,可是他们真的知道自己究竟想要什么吗?还是数据驱动的 Facebook 比我们更懂自己?可能做出比用户自己想要的更吸引人的动态消息吗?
Mosseri 告诉我他并不会过度担心这些。他解释道,这些数据目前为止,都暗示应该多做调查,给予用户更多的选择权,这样可以增加用户的参与度及在网站上停留的时间,这两项看似都是短期最主要的目标。
动态消息推送算法的改进是一个非常长期的过程。如果它恰好每次都击中你的痛点,那也仅仅是一个令人愉快的巧合。在长达十年的动态消息运营过程中,数据从来就没有尽善尽美过。
而算法的改进就是一个否定之否定的过程,今天辛苦写成的代码也许明天就会被无情删除。日复一日,工程师们在 Facebook 门洛帕克市的总部里的研究体验报告,开会,进行一系列测试,然后一次又一次修正算法。