Yahoo浮沉录(三,完)
Yahoo这一路曾经出过很多好技术
然而,任何人如果只是把Yahoo当作一家缺乏聚焦的企业来看也许忽视了公司内部的那些创新—偶尔甚至还有一些很好的产品创意。就拿搜索来说吧,我们说的不是付费搜索,而是指代表实际搜索结果的蓝色链接。Stata在担任CTO之前曾做了很多年的搜索,他说Google曾告诉他,Google对Yahoo相对小的团队(且人员大都不需要斯坦福的学位)能够跟住Google,甚至在某些领域挑战极限是如何的吃惊。
大部分工作都是在他2004年到Yahoo之前完成的,是收购Inktomi的成果,但最令他感到自豪的时刻之一发生在他到Yahoo之后:Google停止显示其索引的URL数量的那一刻,因为他宣称Google意识到在这方面自己无法拉开Yahoo。跟微软的交易里面有一件事是大家都没注意到的,即Yahoo几乎也跟Google也达成了类似的交易,直到政府出面阻止。Stata认为,要说Google交易有可能的话,其唯一的理由是Yahoo对搜索的态度是如此的无情。(他还指出,如果你看看现在Yahoo的搜索引擎就会发现,它仍然负责页面设计以及在侧栏展示的所有附加信息)
早在2005年的时候Yahoo就试图要成为社会化搜索的领导者,因此才收购了Flickr和Delicio.us,并发布了像Yahoo Answers那样的新服务。该公司甚至还考虑过按照用户的社交网络来进行搜索结果排名,Stata说,但最终还是无法摆脱内容,因为它从来都未能产生足够庞大的社交图谱来启动这项排名。(尽管要是Yahoo 360不是独立于搜索团队而建,并且能利用流行的Yahoo Messenger服务的话将会是另一个故事)
“如果没有维基百科的话,我们可能会过得更好,尤其是Answers,”他补充说。
Yahoo为用户对首页内容进行个性化的努力相当令人印象深刻—至少从理论上来说如此—哪怕是在他们低估了自己的媒体公司心态的情况下。那时候Yahoo已经收集了大量有关用户的数据,以及Yahoo上面哪些类型的文章受欢迎的数据。该公司的搜索专家推断Yahoo可以通过开发机器学习算法来预测哪些文章会受到哪一类读者的欢迎,然后定向针对这些来对首页内容进行自动定制。
然而,Stata解释说,该公司最终不得不选定一种办法来让人类编辑及定向算法进行协作,一起来选出Yahoo首页的最佳页面,然后将其呈现给合适的读者。有时候,他们会对文章进行简单的A/B测试,然后让被测试受众点击的内容分发到更广的范围。
“我们对圣诞节试了6种办法,然后想创建内容分类器,但还是失败了,”Stata说:“……流行的就是流行的(没有类别之分)。”
David Ku认为内容优化的随意性结果是Yahoo在搜索方面的相对失败。内容个性化已经有一些已知的技术,但就像广告一样,这些技术有助于了解谁在特定时间在找什么,或者是带着目的的个性化,如Facebook关注于你的朋友那里流行些什么。
“如果是针对我的话,”Ku说:“那么个性化最好要好点。”
不管怎样,一切以Hadoop为轴心
Yahoo最成功,也是最出名的的一项技术努力也许要数Hadoop,正是Yahoo帮助培育了这个开源大数据平台并让它在2011年时成长为成熟的企业平台。
Yahoo投入了成百上千万美元(也可能高达数十亿)到Hadoop的开发当中,而后者也赢得了从定向内容到搜索的Yahoo“每个点击背后”的使能者之荣誉,可以说基本上是这样的,至少从这些点击涉及到分析、定向内容或搜索结果这些方面来说是正确的。Yahoo是在2006年引进Hadoop的,为的是帮助对页面进行索引,以便能与Google在搜索上进行竞争(Hadoop终于在几年之后为搜索提供支撑),但后来它证明自己在Panama(Yahoo为广告商、内容优化、定向广告及许多其他用户提供的分析工具)的后期迭代升级方面也能提供足够的支持。
Hadoop刺激了Yahoo基础设施的若干变化,引导打造富含数据和设计的在线体验的新方式,Ku说。在整个公司范围内,有一个提供内容与分析数据之间的连续循环,从而能为用户、广告商及Yahoo带来更好的结果。
尽管如此,这并不保证得到广泛采用,因为Yahoo的部门之间往往是独立运作的,对于相同的技术会有不同的想法,Stata说。实际上,他承认,搜索团队对此跟其他任何人一样难逃其咎—在集中精力与Google作战时搜索团队采取了一种“地堡心态”。Hadoop是第一个出自搜索并流向各个方向且被认为有用的东西。
“它的确从技术上帮助将公司凝聚到了一起,”Stata说。
Usama Fayyad是在Hadoop尚未完全在Yahoo内部起势的2008年离职的。他承认从某些方面来说Hadoop是个救世主,完全适合于某些工作,但他也指出Hadoop“肩负的担子过重”。“Hadoop几乎就像是一种宗教信仰,”他说。
在他离开之前,Yahoo在关系数据库、NoSQL数据库,甚至一种名为Everest的列式数据库(为与定向广告相关的大数据查询而设计)上投入重金。Yahoo决定把很多的负载全压到Hadoop身上,这部分是由于对该技术着迷,部分是因为要通力协作专注于更少的事情上,而他则把Yahoo的这种做法视为是用推土机去推一颗石子。
的确,Bassel Ojjeh的新公司nPario就因为聚焦Hadoop的决定而受益,此举也让达到产品质量的时间比预期更长了一点。 nPario利用了Everest技术作为其分析引擎的一部分(现在是在Hadoop上面跑Everest),有一段时间把Yahoo当作自己的一个客户。
当你讨论的是这样一个大规模的系统时,Fayyad解释说,它最终会变成一个与技术问题程度相当的业务问题:“维护(Hadoop集群)的成本跟计算创造出来的价值相比是否值得?”对于Yahoo和许多其他公司遵循相同路径的特定负载来说,答案很有可能是否定的。
他暗示Yahoo因为Hadoop而失去了几位最好的数据科学家,这些人看到在其他地方针对更为合适的技术进行特定计算的机会。(也就是说,Yahoo的投入可能为他人利用Hadoop技术做了嫁妆)
最后,想让用户浏览仍需要一个理由
无论是致力于Hadoop也好,投入重金到Panama上也罢,或者是Yahoo那些数不清的收购(包括新任CEO Marissa Mayer做出的那些),在公司不能早点认识到自己的处境并致力于门户以外的任何一件事情的情况下,讨论这些决定是否明智基本上是没有意义的。不管是做搜索的Google,还是后面做社交的Facebook等,其他公司对于消费者会如何使用自己来访问web都有着一个更加清楚的愿景,然后成为了大家优先选择的接入点。
你需要“某个理由说明为什么你要让那个服务成为你生活的一部分,” David Ku说。缺乏聚焦的Yahoo没有用信息或朋友来勾住你,而是提供(平庸的)服务及内容的融合,最终没法为吸引用户使用提供充分的理由。
“Yahoo没有把下一代用户作为自己的定位,” Ojjeh说:“真的,Yahoo是给我这种年纪的人用的。”
Ku认为新任的CEO Mayer迄今为止对于Yahoo是有好处的,至少她为一家一度停滞的公司注入了活力和动力,并且真心想要改善用户体验。然而,她仍需要为公司寻找核心业务(嘿,也许就是媒体也说不定呢!),并找到把它集成进用户生活中的方法。他指出,微软和Google早已根植到设备的世界里并利用这些设备作为消费者接入点了。
不过,即便这些年Yahoo误入歧途且排名已经大幅下挫,但Mayer并非无米下锅。该公司仍然有一些非常棒的技术、技术人员以及对数据的学院知识。还有着亿万用户和通过它的各种服务而来的访客。
“我仍在创业……一切都是白手起家,” Fayyad说:“想象一下,要是你给我一个客户群然后说,‘OK,Usama,你可以拿这700万用户起步。你打算怎么做?’我会怎么做?我会告诉你,绝对会让你大吃一惊。”