2014-04-21 张一鸣-自我演化的信息服务

2014-04-21 张一鸣-自我演化的信息服务

演讲视频:《自我演化的信息服务》

大家好,我是张一鸣。今天是我第一次公开演讲,大概两年前我参加极客的活动,周总讲两年内最好不要在这个活动里参加演讲。我一想两年了,所以我就来了。今天是关于极客关于技术的会议,所以我准备的PPT跟前面几位相对有些不一样,我谈的更多是产品技术的话题,不知道来听的有多少是产品经理或者工程师。

我简单介绍一下今日头条,我是两年前准备启动创业的时候参加了上一次极客公园的活动,到两年时间我们有累计一亿激活用户,并且每天用户在上面消耗的时间有3.5亿分钟,月度活跃用户达到三千万,提供连接人与信息的服务,为用户提供有价值的信息。

我今天重点想讲的是我在做这个产品的时候观察到新的,随着技术越来越丰富,信息出现自我演化的信息服务。

我先解释一下什么是自我演化,应该是这个系统开发完成之后,部署完成之后并不能一下提供很好的服务,哪怕你把这个系统重新拷贝一份部署起来提供服务也不能提供同样的服务,必须经过用户使用过程不断使用,系统不断理解用户的输入,用户每次使用不仅是使用信息服务,并且是教育系统,让系统越来越有智慧。系统会随着这个过程自发成长,大家可以类比一下之前的信息服务,比如搜索。

如果你今天有能力搭建一个跟百度、谷歌一样的系统,第二天能够提供同样的服务。只有极少部分搜索结果有点击反馈的调前。门户基本上每天早上前一天主编把对世界、中国的理解在门户上编排出来,如果总编一旦走了服务质量就下降。

自我演化服务特点不是依靠一个人的经验,并且不是依靠一个不固定不变的算法,我自己归纳它有三个特点,第一个大家都比较理解的个性化,用的越多越懂你,你的每一次输入在某各时间和地点给你一条内容看或者不看,认真看还是粗劣看,参与评论还是分享,每个行为都为系统更好理解提供帮助。

第二个是不是只懂得你部分的信息,其实个性化另一面是泛化,所谓泛化不仅是对一个刺激积极相应,是对这个刺激同质的刺激给予响应。

另外一种说法就是人和人之间总有共通的特点,每个人共同的特点的每次行为就会对拥有共同特点的人效果就会影响到拥有共同特点的人,泛化结果是越多人使用系统就更好懂你。

自我演化系统还有一个很重要的是,它会随着时间的推演越多人用越长时间积累的智慧越多。我举一个稍微形象一点的例子,基本上我们把特征分三类特征,一个是人的特征,环境的特征,文章的特征,系统会记录某个时刻某个地点因为某个原因给某个人推荐了什么内容,如果捕捉到很快滑过这个内容,是读了一半还是认真读完,每一个行为给系统就做了一次教育。这是一个简化的表达,久而久之系统在三类纬度,每类纬度更丰富的组合下统计处了规律,三大纬度分下的子纬度,整个出来都是非常高纬度的举证空间,好处是能够把规律给记下来。我们能够统计出在一个周五的晚上一个清华的男生和一个人大的女生有什么兴趣爱好不同,给他们推荐不同的内容会有不同的反馈。

我认为构建一个自我演化系统基于三种能力,正是最近三种能力大幅度的提升才带来提供这种可能的时间点的来临,我认为这三种能力是观察、记忆、理解。

观察刚刚周总提到手机设备带来了很强的输入输出功能,带来了很多传感器,不论是经纬度还是手势,移动互联网带来了强大连接能力。所以系统云端对用户观察能力大幅度增强。

记忆能力其实最近几年有非常大的发展,如果大家留心关注大概09、10年开源技术领域的普及,我们用户一天会产生一千条日志,虽然互联网时期大家也存储网上日志,但是只统计IP有多少,就是按这个纬度统计一下。但是在自我演化系统中记忆能力要求更高,必须把这些行为数据结构化,必须解析出来,供给批量的存储,批量访问。所以对系统记忆能力有大幅度的要求。

理解能力也是这几年工业界跟学术界带来的巨大进步,理解力是普及应用带来的提升,我们有了很多的用户行为,但是光有日志行为是不够的。理解我刚刚说的每个人用户看或者不看的行为需要更高的运算能力。理解能力又分两个纬度,第一个理解数据规模的能力,这基本上跟分布式大规模机器相关,在之前是没有工业界提供好的方案之前没法理解百万级条记录。第二个跟学术界以深度学习为代表的模型技术发展相关,因为越复杂的模型能够理解的知识越深刻,能够对规定和知识理解的颗粒度越精细。所以在我看来这三种能力的大幅度提高为新型信息服务提供了可能。这是三种能力提高的背景。

我还要提到社交网络发达也对一个人留下他的社交痕迹,你评论了什么,点赞了什么,转发了什么内容也都是给系统更多的输入。

这是我们系统中两个用户信息的标签,这两个都是我们使用时间较长的用户,我们把一部分好理解的信息给提取出来。一个是70后男生,一个是90后女生,系统对他们的理解完全是基于他们的行为,不仅是基于他们的行为,基于他们具有相同共性用户的行为泛化到他们身上。基于对人的理解,对产品的理解,我们就能够随时随地推荐这个用户此时此地最应该感兴趣的内容。

在我们看来与有自我演化能力服务比起来,广告将不再是以门户网站强行插入用户视觉区域的方式提供。基于对用户的理解,广告将更快更精准抵达有需求的用户,可以最小化的非受众的干扰,同时广告本身必须具有可读性,或者它直接能提供服务。

我们之前看到的广告都是以视觉冲击为主,而不是直接提供可阅读性或者能够直接提供服务。这是我们提供的广告的例子,我们系统自动给一二线城市偏数码感兴趣的用户体检一款路由设备,这个转化率都非常高,并且广告阅读率跟同样的文章跟新闻博客阅读率相当的。所以当广告本身具有服务价值,并且提供可阅读性的时候那么用户来说就是一个广告就是一个体验了。

对于今日头条而言我们愿景是理解更多的信息和场景,我们希望在不断增加系统对用户,对用户的观察能力,对行为特征的记忆能力,以及对用户信息场景的理解能力,同时希望理解更多人的更多纬度的信息,这个依赖于用户规模和用户行为的评比,只有三特征下面几十个纬度值展开的话这是一个非常高的空间,只有越高用户行为才可以把自我演化系统教育的越好,系统对知识理解的层次、颗粒度才能够越高,系统才能够自我演化更快。这边我解释一下如果同样两个系统代码一样,部署一样,一个系统经过用的时间更长,使用人越多它能够提供更好的用户。这个过程中技术还是起非常重要的作用,同样积累数据情况下你不同的机器学习的模型对数据的理解能力,对知识记忆能力,以及它的表达能力就是对信息的预测,对推荐结果的预测是会有非常大不同的。所以我们要做的事情是不断提高系统本身能力,同时加大系统更多的输入达到更好的服务。

在这个时间点上看,以前技术变革基本上都是物理技术的变革,不论是造纸印刷还是无线电,基本上是物理技术的变革,但是我们自己强烈感觉到在这个时代有机会通过计算机算法支撑这三种能力工程技术算法大幅度的提高,有机会给全球用户提供一种全新不同获取信息传播信息的方式。

这边周总提的用户隐私的问题,我们说到我们观察记忆理解用户,所以我们也很关注用户隐私的问题,我们原则是我们理解你但不认识你,系统处理过程中把能够标识你的基本信息能够认出基本的信息系统中去掉,变成匿名的ID,我们理解某个用户某个场景下很可能喜欢某类东西,但是不认识用户是谁。第二你的信息为你服务,考虑到泛化情况下,你为你自己,你为其他人服务,所以我们符合周总讲的安全三原则。

今日头条我不知道在座有多少用户,其实我们在跟用户交流过程中能够听到非常多的反馈,看到后台很多的反馈。那么有人说一个自我演化系统是不是能马上提供非常好的服务,这只是一个开始,我们在这个过程中已经看到,在目前观察理解记忆能力情况下系统已经有机会提供比之前用其它方式所不能提供的服务,随时随地找回你感兴趣的内容。当然在这过程中我们还要大幅度提高解决推荐准确性,通过这种方式提供有效信息服务,尤其是打造一个可以自我演化,不断改进的系统我觉得这是另我非常兴奋的事情。

好,谢谢大家。

    热门主题

      • Recent Articles

      • 2006-02-28 Warren Buffett.How to Minimize Investment Returns

        Refer To:《2006-02-28 Warren Buffett's Letters to Berkshire Shareholders》。 How to Minimize Investment Returns 如何把投资回报降到最低 It’s been an easy matter for Berkshire and other owners of American equities to prosper over the years. Between December 31, 1899 ...
      • 2003-02-21 Warren Buffett's Letters to Berkshire Shareholders

        Refer To:《2003-02-21 Warren Buffett's Letters to Berkshire Shareholders》。 To the Shareholders of Berkshire Hathaway Inc.: Our gain in net worth during 2002 was $6.1 billion, which increased the per-share book value of both our Class A and Class B ...
      • 2004-02-27 Warren Buffett's Letters to Berkshire Shareholders

        Refer To:《2004-02-27 Warren Buffett's Letters to Berkshire Shareholders》。 To the Shareholders of Berkshire Hathaway Inc.: Our gain in net worth during 2003 was $13.6 billion, which increased the per-share book value of both our Class A and Class B ...
      • 2005-02-28 Warren Buffett's Letters to Berkshire Shareholders

        Refer To:《2005-02-28 Warren Buffett's Letters to Berkshire Shareholders》。 To the Shareholders of Berkshire Hathaway Inc.: Our gain in net worth during 2004 was $8.3 billion, which increased the per-share book value of both our Class A and Class B ...
      • 2006-02-28 Warren Buffett's Letters to Berkshire Shareholders

        Refer To:《2006-02-28 Warren Buffett's Letters to Berkshire Shareholders》。 To the Shareholders of Berkshire Hathaway Inc.: Our gain in net worth during 2005 was $5.6 billion, which increased the per-share book value of both our Class A and Class B ...