2025-02-14 Shuchao.创立YouTube Shorts的故事,如何预测科技趋势,在大厂创新的领导力

2025-02-14 Shuchao.创立YouTube Shorts的故事,如何预测科技趋势,在大厂创新的领导力


Shuchao:
没有经济基础是没办法谈科研的。

课代表:
新的卖家,新的供给方,如果他们找不到成功的话,这个生态很快就枯萎了。这个也好,这个也好,这个也对,这个也对。那你要选一个而不选另一个,这个时候你是怎么做决策的?

Shuchao:
任何科技的产生都有它不好的地方,但我们不能只盯着它不好的地方。这四点理由我们觉得短视频一定会是未来。

课代表:
有的盯 Territory 的人就会过来侵占你的 scope,你会怎么处理呢?像现在做成功了,作为这里边的元老,你选择离开的原因是什么?

Shuchao:
人的 motivation 是什么?

课代表:
课代表,欢迎你。我给大家准备了两句话的介绍。第一,你是创办了 YouTube Shorts 的人。第二,就是前几天 OpenAI12 个发布里边,你的团队占了 5 个。

Shuchao:
有一点噱头感觉,就有点可能有点搞点的。

课代表:
肯定有噱头。如果你不说噱头的话,大家就没有兴趣去了解后面说的东西了。好的,我就想把这两个正好拆成两个话题去聊,因为这两个话题都挺大的。第一个就是 YouTube Shorts, 我们当时是在 Clubhouse 上就是听说了你这个故事嘛。当时简单听了一下,那个时候你就是非常这个 Bullish on Shorts。然后当时我其实那个时候我在 Meta 嘛,然后 Meta 我内部已经听到很多讨论了,就大家觉得 TikTok 是个非常大的竞争,然后觉得 TikTok 非常厉害。

Instagram Reels 是过一段时间才 launch 的,但是在那之前有一个好像是 Lasso 对,Lasso 在拉丁美洲,然后做的不成功,后来又做 Reel,就是 Facebook 已经非常重视了。但是从你的当时的那个话听起来呢,Google 没有形成一个 consensus, 就是 Google 在你做的时候就它不觉得这个 Shorts 对它的现有生态是一个很大的威胁或者是一个非常大的未来,这是我的 impression 啊。

所以说这让我想到了,我刚刚介绍了你说你 founded YouTube Shorts 或者说 co-initiate YouTube Shorts, 很多人就会觉得啊你运气真好,你是站在了这个风口上,然后你踩中了一个很很幸运的大舞台。但是我听你一开始的故事和看你的朋友圈,觉得这其实是一个非常艰辛和一个在 Google 内部非共识的一件事情,是靠你自己把它往前推。Shorts 才走到了今天这一步,我不知道这个感觉对不对。

Shuchao:
我可以稍微介绍一下 Shorts 是怎么起来的。其实挺偶然的,我不知道从什么时候开始说起来,说故事就长了。我们就分 Shorts 吧,之前可能等会再说。我到 YouTube 之后让我负责的一个产品叫 YouTube Storage,我团队是负责 Discovery 和 Infrastructure。其实我去 YouTube 挺偶然的,因为我的 YouTube 的其实也没有聊特别多说具体要做什么,然后就给了我这么一个肉。

过去的第二周,我记得很清楚,跟我的一个团队成员,我们俩在一个小黑屋里面,一个会议室里面待了一下午。我把所有的那个产品的数据看了一遍。然后我后来发现这个产品在 YouTube 的天花板实在是太低了,因为它是一个 social 产品,它的 supply 和 demand 是严重失衡的,在 YouTube 这样的 ecosystem 下面。然后当时我就。

课代表:
是 demand 太高 supply 太低?

Shuchao:
没有 demand 也没有 supply。对,然后当时是人为的创造了一些 Demand, 所以我觉得当时我们最大的问题是要创建这种 Permanent Content, 而不是这种 Service,就是阅后即焚的内容。因为阅后即焚的内容是没有,它只有很强的社交平台才能做起来。他的这个内容是不积累的。后来我就比较系统的研究了一下中国和美国的视频的发展历史。就视频平台的发展历史就很有意思。当时我写了写了一篇公众号 19 年的时候,就是在对比中美两国视频发展视频平台为什么这么发展呢?

就是有这么几个趋势。第一个趋势就是这个创作的门槛越来越低。从电影。电视剧到长视频平台到短视频平台,它的创造门槛是越来越低的。你是需要一个大导演才能做电影之前,慢慢的你是一个比较小规模的制作,一个电视剧也可以做了。2005-06 年开始,在美国,其实主要是美国练成了你只要有一个专业的摄像机和视频编辑的能力,也可以做的。其实 2005,06,07 年这些时候,中国有很多类似 YouTube 的网站,优酷,土豆这些。其实这些本质意义上都做的,在 UGC 上面都做失败了。

他们后来都转向了做电影,电视,IP 这些。最本质的原因,我当时得出来的就是, 学习研究得出来的结论是说,当时中国是不存在创作者生态的,因为创作门槛太高。就是 05、06 年的中国是没有多少人有专业的摄像机和专业的视频编辑软件能力的。

课代表:
视频编辑软件确实。我当时想这个东西对美国是不是用,但是后来想美国起码大家都有编辑软件,而且就是它的这个视频整个的生态已经很久了,所以说相应的人才总是有的,但中国确实这方面还很少。

Shuchao:
我说一个很好玩的例子吧,就是我不知道你知不知道后舍,就中国的第一代网红,不知道,上研究生的时候还大学的时候,他们就特别火,他们就 lip sync 后街男孩的歌,他们当时拍的那个视频质量是极差的,也不是剪辑出来的,就是一气呵成,后来就特别有意思的故事什么呢?我们当时把这其中一部分研究,我总会说其他的几个理由,接着说这个历史,就为什么短视频首先,发生在中国大面积起来就是因为 UTC 的视频创作和消费没有被满足这种需求。因为中国的长视频平台没有 UGC 几乎是。

就是很自然的,我要等到这个创作门槛下降的时候才会起来。那什么时候创作门槛下降了呢?手机。就每个人都有一个很好的摄像头,每个人都有很好的视频编辑在这个手机上的能力了。那好,那 UGC 一下就起来了,快手站在了这样一个位置上面。快手其实以前做 GIF 其实也是一个特别好的 idea。是,但是后来就短视频突然就起来了。我觉得这是历史的必然,尤其是快手的快手动程是在中国的 4G Unlimited Plan 出来之后,就大家不停地低成本的刷手机了,就是在这个时间节点卡得特别好。

当看某件事情都是偶然,那这也是历史的必然。这个市场肯定要有个产品去满足。当时特别有意思,你可以看后舍男孩的这个创作根本就不专业。相对于 YouTube 的视频,YouTube 这个博主的标配是专业的摄像机,但是加一个专业的视频运营软件。然后那时候 05、07 年那时候中国是没有的。后来就这个故事特别有意思呢,我们当时给当时 YouTubeCEO susan,那个今年其实去世了,特别好的一个 CEO, 看这个就是中国视频平台发展历史的时候,susan说我记得这两个男孩,为什么呢?

他们 Lip Sync 的一个歌曲叫 I Want It That Way, 是后舍男孩的歌,是 YouTube 上面第一个超过 100 万有机播放量的视频。而且当时对 Google 收购 YouTube 产生了很大的影响,就是这是一个故事的闭环,就特别有意思,当时中国我忘了是广州美院还是哪哪哪有两个大学生这个影响了 Google 收购 YouTube,因为大家觉得哦,这就是创作创作的未来,而且那特别好玩的另外一点就历史的闭环呢,这两个人也是从 LipSync 开始的。

TikTok 之前的前身就是也是从 LipSync 开始, 这 LipSync 是一个非常 viral 的东西,对非常 viral 的东西。然后这是从第一个就是从创作的角度来讲,我们觉得大事是创作门槛越来越低,短视频平台肯定会起来,就短视频的另外一个意思你可以理解成是手机创作的视频,在最开始的时候。第二个我们就谈到从消费区市场来讲,很多长视频平台的时长跟可能 Facebook 的时长这种 fees 产品的时长是总时长是差不多的,

但他们的广告的营收可能只有在同样的时间下只有 Facebook 的三分之一到五分之一,因为 Facebook 是一个就这种 fees 的旅游产品和社交产品,它更多是一个用户可以每天打开十几次几十次的产品,然后长视频平台大家可能就打开个两三次一天,然后有一个不恰当的比喻就是这个长视频平台更多的是一个正餐,就大家吃早饭,中饭,晚饭,对吧?这个短视频的应该是零食,你可以一天吃几十次零食,你知道 QQ 视频的老大去说抖音是猪食,抖音是猪食,我们回到刚才说这个你提到的这一个观点啊,
Idea
非常好的比喻。
因为当时也有很多反对的声音,我可以可以讲一下我我个人觉得是什么样一个什么立场了。所以我们觉得这样的消费模式会更好,然后它也是一个更能够让用户得到满足的产品。

课代表:
我就是先埋一个点啊,你一会说你的,然后我就待会先埋一个,以防我忘了。就是站在那个 19 年 20 年的节点,你会看到国内和美国的讨论,国内抖音已经起来了嘛,然后大家已经开始研究快手和抖音的生态,然后已经有比较共识的认知。你跟国内的一个大厂 pm 去聊抖音和快手是怎么回事,他们都能跟你说这个东西为什么牛逼。当然在美国,你看你要从头去做,你要去出这个文章,就是你作为一个 engineer 的 leader,对吧?

他不是这个 YouTube 的 CEO 去做这件事,CEO 去做这件事,也不是一个 pm 去做这件事,而是你就是你的这个认知在当时的 YouTube 里面内部是非常领先的。这就让我在想就是这个背后是怎么回事,以及为什么一会儿要讲的 leader 是 principle 吗?就是为什么你作为一个 engineer manager,你会去想这些 strategy 的东西。不过我们先把这个问题放下,我们先继续你的这一条。

Shuchao:
我可以简短说一下,其实每个公司文化不太一样,不过是一个 engineering driven 的公司,就是一个好的 engineering 的肯定是要是一个好的产品经理和这个好的 program manager, 其实每个公司的这个这个调性可能不太一样,比如说有些 research line, 它是 research driven 的公司,就 research 这边的话语权要高很多。我们回到刚才的故事,第一个我们觉得短视频肯定是未来就是从创作门槛越来越低的历史趋势来看。

第二个是它是一个更好的消费模式,从消费的来看。第三个是它变现效率极高,就刚才我们说到它其实更像是一个 social network 里面的 feed,然后它的变现效率即使不加上国内的玩法这套直播和卖货,它也比长视频的变现效率高三到五倍,加上直播和卖货可能就是五到七倍。甚至更高,对吧?

课代表:
就是前面是这样的吗?就是我觉得我自己作为创作者在 YouTube Shorts 里面得到了的分数很少。就是如果我们抛弃商单了,你说的应该是广告的效率,然后现在是这样的吗?因为 TikTok 的这个变现效率比 Instagram 还差很远。

Shuchao:
我觉得在海外可能不如国内那么夸张,但是你相对同一个小时,你对比这个长的视频和短的视频,这个短的视频的变现效率要高很多很多。因为你在长视频里面放广告是非常不自然的。比如在用户想点开的时候,你插几个广告,或者在中间插几个广告,对用户的打扰度非常高。那短视频呢其实更像这个 feed, 更像这个 social 的这种 feed. 你其实每一个都有一个很自然的断点,你这个滑过去不会感觉到你,你非常的受打扰。然后第三个我觉得就是短视频是未来的一个一个原因。是因为其实变现,

不管是再前沿的研究,其实到最后都都要有一个好的变现机器,它才能维持你长期的投入。就设置这一波大模型一样,就是一定要有一个很好的就是大家靠信仰可以支撑几年千年的研究。但是你看历史上过去几千年人类历史上的很多研究都是在极其富裕的情况下产生的,你就没有经济基础是没办法谈谈科研的。然后第 4 个呢,我们觉得短视频是未来的一个原因,是从生态的角度来讲,短视频可以造就一个基尼系数更低的生态。为什么?因为它创作门槛的持续下降,使得越来越多的人可以成为创造者。

历史的角度来看,从互联网产品,比如说 Yahoo 和 Google 的本质区别是什么?是 Google 的分发更长尾,然后大家一直觉得长尾不重要,其实不是的。Yahoo 是把你最常用的比如 100 个网站放在那边导航,但 Google 可以把后面几亿个网站帮你弄出来,这个力量是巨大的,它的基尼系数是要远低于 Yahoo, 然后你再从中长视频到短视频,它的基尼系数也在降低,那基尼系数越低,不管是从社会学还是从这个互联网生态,它的产品的活力是越高的。就你像小红书为什么这样

小红书是一个基尼系数极低的一个产品生态,这是非常非常好的,而不是说这个一两个网红或前十名网红它它 dominate,这个整个的流量其实对于平台来说是非常非常不好。

课代表:
我们当时在做电商的时候有这种感觉,就是你基尼系数高了以后,就是几个大头,然后这个生态就死掉了。新的卖家,新的供给方,他这上面找不到成功的话,这个生态很快就枯萎了。

Shuchao:
回到刚才你说的,这是四点理由我们觉得短视频一定会是未来。我还带了 YouTube 一些人我们去上海,待了一周,其实做了用户调研,采访了抖音的 16 个创作者当时,就四个比较大的,八个中间的四个比较小的,然后当时还挺有意思的,就在那个梅龙镇广场,以前经常去的那个大使馆的那栋楼,对我们的那个大使馆的楼上还是楼上几层,请了一个第三方公司,很有意思,他们就是这种调研的时候是一个单面玻璃,这个视频是类似的,然后那边有个翻译,他其实也不知道是谁在问他问题各种,

其实挺好玩的一次调研经历,回来给大家出的报告,大家都极为震惊,中国的短视频已经发展了这么的领先,就是创作者生态来说,你提了一点特别有意思,你说谁的哪个人说说抖音是猪食,立场,他的立场。我觉得我们提出这个想法,就很多人 challenge 我。他问的问题是,Shuchao,are you building something good for the society,or for the human mankind? 我其实很难回答这个问题,但是我举了这么几个例子。

第一个例子是说,我觉得短视频里面有很多很好的内容,包括很多数学证明,medical visual proof,很多 IT 的 physics lab, 有一个物理实验的频道特别好看。然后也有很多平常看不到的,比如长视频看不到的内容。现在的话,平均每人一天可能消费 5 到 10 个长视频,但可能消费 500 个短视频,然后对播客短视频使得你的视野可以非常非常的广。比如说有一段时间我特别沉迷于这种工厂里面的这种机械是怎么工作的,比如说你的旅行箱是怎么制作的,你一般是看不到的,

只有说那里面的工人拿手机拍到了,你不会看一个长视频,然后这样使得你的人生阅历会变得很丰富。其实我觉得他有他。好处的地方,当然,这些人 challenge,他的原因是说,哦,他会使人的这种 attention span 变短,那就是可能是不是会对人类是会变成不好的影响。我觉得也不一定,因为我们这代人是伴随游戏机长大的。我父母这一代人就老觉得你们这一代人打游戏浪费了太多的时间了,就是垮掉的一代。但其实也没有,我觉得我对社会的贡献也挺大的,长大之后。

所以我觉得保持一个 open-minded 的心态很重要,就是在趋势面前一定要有趋势,而不是老是挑战它。任何科技的产生都有它不好的地方,但我们不能只盯着它不好的地方。

课代表:
我这时候多说一些,提供一些想讨论的。因为我知道观众他这里最后有很多问号,或者说很多这个带着自己情绪的。我自己作为一个经济,我我自己是一个 Econ PhD 嘛,然后经济他一般是喜欢这种就是 Normative 和 Positive 的这个说法,就是我们不带 judgment,大家嘴上说我要学习,但是刷的都是小姐姐视频,那你应该给大家小姐姐视频,而不是去给大家嘴上说的那个学习学习的东西。

但是我可能更关注的视角是我们有一派人, Effective Accelerator 吧,就是这种降临派。他就觉得,对嘛,就是技术来了以后,你应该去拥抱技术,然后你在这里边去阻挡它。首先,你凭什么阻挡它?你凭什么觉得这个是好的,那个是坏的?就是你也没有一个上帝视角。你也不能去替其他人做决定。既然别人已经用他们的行为做了决定以后,你应该尊重大家的决定。这个是我的想法。但是这个想法并不是一个 popular 的想法,因为这个世界上大家喜欢别人来替我做决定,

或者起码我可以 blame 别人 for the consequence of my own choices。就会有人去说你不应该给其他人这些 content,然后另外的一些人就说对,平台不应该给我这些 content,虽然我天天刷的都是这些 content。那这个在你推行这个 initiative 的时候会是一个非常大的阻力。因为越是身居高位的人,我觉得,或者说越是声音大,就这种人的声音,你没有办法去反驳他们。他们说的是对的,但是你很难反驳他们。

那你除了去做一些就是 positive 的方面以外,你当时还遇到了什么样的阻力和你是怎么样子处理这些阻力的?

Shuchao:
我觉得我们一是就质疑的阻力说这件事情到底对社会是不是好事情,对吧?然后第二个是说比如说当时我们遇到的最大的一个困难是什么启动?我们是 20 年的 1 月份还是 2 月份上线的?就在疫情前两三周就上线之后两三周就疫情为大家工作了。然后其实很神奇的一个体验,我们前四五个月的这个产品质量是极差的,然后那个时候每一周我会把用户给我们的反馈都看一遍,因为那时候用户少了,就自己还是看得过来的,不需要有人拿模型去处理,

然后有一个人说 You should fear all engineers working on this product, 就是产品的质量坏到这种程度,为什么呢?因为没有需求,也没有供给,本质原因是没有好的供给,所以我们大概花了四五个月的时间去 figure out 怎么去冷启动,有很多的时候,就是在产品很差的情况下,你的压力也很大,就是阻力也很大。那当时我的谈判的技巧就是给我们一定的时间,比如给我一年的时间,我们能做到什么程度。

如果我们做不到什么程度,我们愿意去放弃这样一个程度。所以这一年的时间其实就是给了我们很多一年的这个 exploration。

课代表:
谈判的对象是谁?这个是个等高层级的人?

Shuchao:
这个可能就不太说了,可能在 Google 呆了比如说 20 年 25 年这样的人。

课代表:
我问这个问题的原因是 YouTube Shorts,因为我可能在 Meta 我知道这件事情,在 Meta 的认知有多高,所以说我会以为它是一个整个 Google 或者 YouTube 战略级的东西,只许成功不许失败,所谓这个意思就是说我这件事已经是要做的,只不过换不同的团队来做,这个团队做不好,换个团队,当然总是是一档做成的。但是这种情况也不一定能完全能做成,比如说腾讯想做短视频就一直没有做成,

可是听起来你当时是 Google 或者 YouTube 在这上面的唯一的一个 Batch, 且如果说你的这个东西没有做起来的话,YouTube Shorts 可能就不存在了,是这样吗?

Shuchao:
Shorts 是我们开始的。当时从 Starway 开始,我们觉得 Starway 的产品必须要 pivot,否则天花板太低了,然后没有自上而下的一些 back,或者任何地方。

课代表:
好难,这样子吗?就是自下而上的去达成一个战略产品这件事情,那你是怎么样子,就是他这个有另外一个问题,另外一个问题就是说他在整个公司的战略角度上来说是非常非常重要的,你在 link 上也提到了,就是这个 PGI 他在 203port, 当你们做成了以后,但是之后的时候, 这是做成了以后所有的人都会上传,这就是另外一个问题,就是我也经历过这样的事情,就是你在最需要大家帮助的时候没有人帮你,你在最需要大家帮助的时候大家都来挑战你,但是你一做成了以后所有人都说哇,
Warning
白痴的思维模型。
然后全都过来 report 你的这个成就,那你在最需要帮助的那个时候是怎么样子挺过来的,然后你又是怎么能把它一路捅到那么高把它给。

Shuchao:
我觉得可能不是特别 fair 是说没人帮助我,其实有特别特别多人的帮助我,只是说也有很多人去质疑这件事情。我们刚才只说了质疑的一部分,那其实有特别多 YouTube 的包括 CEO 是非常支持这些项目。但是经常会有人挑战你,有人反对,说这样这样不好,或这样做不成,这样不是一个好的方向。

课代表:
刚开始做 19 年底到 21 年,也就是前两年,那你觉得顺利吗?

Shuchao:
我觉得还行,就是我们第一就是团队还不错,我们招人,招了很厉害的人,然后慢慢地把这个产品做起来。当时招人标准还挺高的,其实 Google 内部的 transfer 我大概面试五到二十个人才招一个,所以你可以想象我们团队的这个平均水平可能是 Google 的 at least top 10%。而且我招人的时候很赞重的一点是他是不是有同样的 vision。就是他们觉得是不是短视频一定会是未来,而且是一个对社会有益的未来。

不管再厉害的,他认同这样一个 vision,他才可能把这些事情做好。

课代表:
是,就是 mission-driven 的能量要比其他的都重要。对,你说的这个厉害的团队是推荐方面的团队的。

Shuchao:
推荐搜索视频理解这些,把一个短视频产品做起来,背后的技术。

课代表:
产品本身,就是这个 YouTube Shorts,到底是以什么样的形态出现在 feed,然后你怎么样去 prompt 创作者去上传。Shorts,你怎么样做 communication,然后你怎么样去运营这样一个就是 supply and demand 的 balance 吧。这些东西是你们用工程的方式解决的,还是也有对应的这种产品团队专门解决这个问题。

Shuchao:
大部分是一块解决吧,包括什么样的入口。我们最开始。从 19 年开始,我们想要的预扣入口是给我们一个 tab,但是这件事情可能持续了一年半,可能两年之后我们才得到了一个 tab。最开始入口就是在这个主页上面,偶尔会有,你可以点进去去消费,没有一个特别 deterministic 的入口。当时我们做成了之后,产品到一定的量级了,才拿到了一个特别 deterministic 的入口。

另外一点我想说明的一个可能就是刚才我们太过于强调,有一些反对的声音,但其实在这个过程中我们得到了大部分人的帮助。包括 YouTube 内部,包括 YouTube 外,我们跟 Google Brain 合作的非常非常多。那边非常多的团队给我们了很大的帮助,包括怎么去做视频的理解,怎么去做推荐的模型。其实最终 convert 的结果,我把它叫做第四代推荐系统,其实跟大模型非常非常的像,有一个类似于 pre-train 的阶段。然后有一个类似于 RL 的阶段去做探索。

我当时大概给推荐系统分了一个几代,然后我觉得我们把它当成是第四代这个推荐系统。

课代表:
你来讲一下这四代分别是什么,它们特征是什么。

Shuchao:
我看我能不能记清楚。第一代呢,我们觉得是基于内容的推荐,就把各种内容打标,哦,这个是 action movie,这个是 romance,这个是什么,对吧?通过这个 collaborative filtering,通过矩阵分解啊,就帮你推荐这个类似的这个电影或。

课代表:
tag和人的交叉推荐。

Shuchao:
对对对。我第一个可能是还是纯基于内容。第二可能就是刚才我们说的基于学习了。有一些 completion 和这些。然后第三代是基于深度学习的,就是把里面分成很多很多步,然后用深度学习去预测各种的这个指标。我把它分代的标准是每一代它的这个服务的平台,你可以想象成其实 Netflix 这种平台或者电影平台最开始其实是一个单边平台,就它的供应是固定的,它只有说怎么去拿着固定的供应去去做分发,对吧?慢慢的你就可以想象长视频平台可能是一个 1.1 边平,其实并没有那么多人创作,

也当然要比电影还要多很多量级的。因为 YouTube 创作者还是要比这个导演个数要多很多很多很多的。或者比如说叫成 1. 5 边的这种平台第三类呢是短视频平台我们可能把它叫成更多可能 1. 8 边这种平台对吧?然后社交平台呢可能就是 1. 9 边或者真的是双边平台绝大部分人既是创作者又是消费者。从刚才我们的分类呢,就是第一类推荐系统是适合于比如最开始的那种电影和电视的推荐。后来呢,有了比较强大的这个机器学习这种引擎之后呢,可能是第二代。

然后深度学习从 2013,14,15 年开始的广泛地用到推荐搜索广告里面之后的,我觉得这是第三代。然后第四代就是真正的用到一些类似于就 LM 类似的人工智能的这样一个系统了。

课代表:
可不可以再展开说一下 LLM 的这句话的意思是什么?

Shuchao:
你可以想象成 LLM 的两个核心点就是一个是 pre-train,一个是 RL。在推荐系统里面,我们觉得 pre-train 就是一个 memorization 的或者是 Mostly Memorization 的一个过程,就是把你的行为数据都记下来,或者是大家的行为数据都记在一块,然后看看里面的generalization。然后 RL 那部分呢,我们就更多是探索,不能说你喜欢看小姐姐视频就只给你推荐小姐姐视频,而是要探索不同的路径,让你的 reward 变得更高。

课代表:
这件事情目前在 YouTube 的推荐上做得极其生硬,就是我其实不是很喜欢 YouTube 的推荐算法。会甚至在固定的位置给我专门推荐我一直看的东西和就是几百个 views 的这种东西,然后试探索,就是我觉得这部做的很生硬,versus 如果你在抖音啊,Facebook 啊,Instagram 这样推荐,就是那个东西,哪怕小红书推荐,感觉更 native 一些,就没有那么的生硬。所以我在想这样一个推荐的代计划分。

我再说一个背景知识,就是我当时离开 Facebook 之前,我的一个 mentor 是 Facebook Ads,就是比较深的做 research 加 data 的人。然后他说那个时候是 2021 年初,就是 Facebook 内部尤其做 ads 的这些 research 比较厉害的人,他们看到了抖音的模型,TikTok 的模型,比 Facebook 的模型大 10 到 100 倍。

我们现在虽然说大模型,但是那个时候他说的不是 large language models,而是就纯粹是从模型的 size 的角度来说。然后他们会觉得抖音的推荐能力其实比 Facebook ads 的这些推荐能力要强。他是从这个模型的大小或者这个参数量去思考这个问题的。然后你刚刚呢一个是从适用的平台和他的这个感觉推荐的范式吧就是他怎么样子去得到信息来。然后我在想就是如果我们从推荐的这个问题本身出发的话。它怎么划分?

Shuchao:
其实这两个非常的相关。可以想象成内容的推荐参数量是极少的。Clever Filtering 类似经典的一些算法,它参数量慢慢的变大。到深度学习,它的参数量就变得很大的。现代的这个,可能大家还在探索处在第四代当中,就怎么把这个模型做大。因为大语言模型之所以可以把模型做大,是因为我们发现了一些结构式的他真的是就是能够你给我喂多少数据我都能学。伊利亚形象说 All the models just want to learn。你把数据给他喂给他他就能学。

推荐里面很大的问题呢他的 tokenization 是非常难的。比如说你用 video ID, 但是我每天的 video ID 都在变。不像语言,就是说大家 token 是固定的,当然每年也会新词出来。但是这些相对于这个既有的知识来说是极其微小的。但是你看抖音上面可能每天火的内容都不一样。

课代表:
是,刚才就是 Video 的 tokenization 很难,这是一个非常本质的观察,然后我也想确实是很难。我们第二轮讲你在 OpenAI 的工作,我猜也会聊到这里边,我们到时候在那儿再 deep dive 一下。然后我这儿的一个直觉是产品上的直觉吧,就是抖音它的人的介入的程度很深。而且这些介入的人很懂,他们是真的天天就是在那儿做这个运营。所以说一定程度上把算法的很多东西给弥补了。而 YouTube 的这个运营策略人定下来的这些规则可能很大程度上限制了他的这个推荐。

Shuchao:
但是这是国内公司和海外公司很大的不一样。国内公司是非常愿意而且很懂运营的。海外公司几乎不太做运营。

课代表:
但是这个 strategy 在我看来真的是很难受让我。

Shuchao:
但是就是说你可以观察到就很厉害的人也被 overfit,就是过拟和他过去的成功。比如说我们做一些新的事情会有人提出来不同的观点。我觉得这些都是好的观点,但是他很多时候是过拟和他过去的成功。就比如说有人跟我提过在 meta17 年 18 年开始,因为 meta 很多高层是中国人,跟 zarkberg 提过说抖音那个产品非常非常的厉害,你应该看一下。然后当时 zarkberg 的回答是说哦,这不就是我们 feed 的全屏版吗?

就他们都把它当成一个创新,而是说自己做了本质创新,他们只是说 adding a tiny amount of innovation on top of that,对吧?

课代表:
对。

Shuchao:
就三体里面说的一句话特别的好玩,这个渺小不是生存的障碍,傲慢才是,想要长久的成功,必须要保持一个非常开放的心态,叫 open minded,要理解这个社会的进步和别人的创新。

课代表:
正好这个地方我觉得就非常好的转到我们这个问题的下一部分,就是你的 leadership principle,或者说是 philosophy, 可不可以给大家介绍一下,很多东西在你说起来轻描淡写一点,但是我觉得换一个人去做同样的事情未必能成功,所以说这就是厉害的人经常感觉不到自己的厉害,但是你起码可以介绍一下你是怎么思考这些问题的,剩下的东西大家自己来评判就好。

Shuchao:
我觉得把团队也好产品也好增长的过程中学到了很多 license, 就有些是别人教的,比较厉害的人或者比较崇拜的人教我的,有些是可能自己犯过错之后学到的,我们有一个小圈子叫 Bay Area Data List, 就是做数据人工智能的这样一些大哥公司的一些 leader, 我们每个季度会聚一下。当时我在分享一些这些 leadership principle 的那个试卷,把它很好的形象的成了就人的这种各种器官。对对对,我就拿这样一个 framework 跟大家说,我觉得也比较容易记。

我觉得一个比较好的 leader 要具备下面几个特质。第一是 vision,就在他所属的行业,不管是技术也好,产品也好,要看得非常远,然后看得非常深。这就好比一个人要一双非常好用的眼睛。第二个呢?是要有清楚的 strategy,光看到远处时还不足够,你要知道怎么去从现在去走到你要看到的远方,对吧?第三点是要有很好的 execution,其实很多创业公司或大公司一样,他们的 vision 和 strategy 可能差不了特别多,但是就 execute 好不好决定了实际的成败。

对比到人,他有一双非常 capable 的 hands,第四点呢,是要有一个 empathy, 就是要带领团队也好,要把产品做好也好,因为要理解别人是怎么想的,一定要经常站在用户的角度,站在团队成员的角度去考虑问题,而不是说自己想怎么样。这就是对比到人要一个非常好的心。第五个是他一定要 take risk,就是对比到人呢,要有 guts。承担任何风险是不能够做很好的创新的。我都忘了第几个,第七个还是第六个了?第七个了,对。
Idea
对平常心和洞察力有非常好的理解。
我个人非常看重的一点,可能有点 controversial,我觉得沟通能力非常的重要。

课代表:
这个为什么 conversial 你觉得?

Shuchao:
我招人的时候把他放在很重要的位置,但是可能有些人觉得这个人只要很聪明,能够做事情可能也就够了。但是我其实把沟通能力放在非常非常重要的位置。沟通能力不只是说你要会说,你首先要能听懂别人在说什么,然后做出声音的这种。对对。在我的这个比喻里面,他就是有嘴巴和耳朵。

课代表:
我稍稍吃惊一下,就是我认识的所有的领导,他们都把沟通放在一个非常非常重要的位置上。基本上大家都会强调两件事情,就是第一你要是一个就是聪明,然后 good with people,good with people 在很多地方都是非常非常重要的。有点吃惊就是到现在会有人觉得这个东西不重要。

Shuchao:
我不是觉得有人不重要,而是我觉得看放在什么高度,我甚至拒绝过候选人,就是各方面都很强,但是我就沟通下来非常的不顺畅。就为什么沟通非常重要呢?当然,可能有了 AI 之后不一样,每个人成为一个 superhero, 其实不需要沟通,但是我们现在的阶段就是需要团队协作,你的沟通成本是随着团队的人数成平方上升的,所以沟通效率很大程度上决定了一个团队的工作效率。

课代表:
对,我们刚刚说了 7 个器官,还有吧?还有一个 self-reflection。哦,你在看,你在作弊,不从我笔记的,对的。

Shuchao:
对对对,还有一个就是特别好的 leader 应该很多都具备的一个特质是他经常会反思自己做的事情,中文有句话叫一日三省无生嘛,就是说晚上睡觉之前会想要今天我哪些东西做得好,哪些东西做得不好,就是产品上面也好,对人事上面也好啊,就跟大模型一样,你要不停的反思才能够进步,这可能第 8 点。

课代表:
这几点我觉得都挺好,我也会把你的 medium 链接发给大家,然后大家如果想看的话可以看。但是这又带来另外一个问题,就是大家会说你要求的是一个六边形战士,然后这个世界上不存在六边形战士,或者说我当然知道要在这几个方面都要做好,但是我也不可能在每个方面都做得最好或者怎样。那可不可以再请你说一下就是一些关于在这个领导力里面,你觉得什么东西最重要和什么东西它在你面临选择的时候能帮助你去做更好的交易?

所谓面临选择就是这个也好,这个也好,这个也对,这个也对,那你要选一个而不选另一个,这个时候你是怎么做决策的?

Shuchao:
我先 push back 你的问题一下,然后我会回答你的问题。我觉得成年人什么都要,不做选择。最主要的是你要认清自己哪方面强,然后你要招到人去弥补你的不强。所以你的 leadership bench 一定要全面。你作为一个 leader,你最重要的是招到一个 leadership bench,一群人帮你去管理这整个团队。你知道自己哪里强哪里不强,你也要招到你不强的那方面的人才来弥补。我觉得这个有点侧面回答你的问题。

正面回答你的问题,我觉得认知是最重要的。就作为一个领导来说,因为认知决定了你会把精力放在哪里,就第一点,就 Vision 是最重要的,就如果你大方向搞错了,再努力,你沟通能力再强,你再怎么样其实就很难。

课代表:
我就是在问一个问题啊,就是跟那个硅谷徐老师聊的时候就讲,应该是 18 年还是 19 年,在 Google 的大会上就说,从今以后 Google 是一家 AI company, 当时还是有点 controversial 的这些话,因为那个时候大家可能热点还是在 mobile 上,就是他那个时候已经说了是 AI company, 但是在今天感觉 Google 以它的资源,不光是钱卡还有人的资源和他产品的资源来说,他在 AI 上感觉他的速度是很慢的,或者大家都对他是不够满意的,

他的大模型也不是 state of art。他的产品上的 integration 也很烂,做得很一般。你作为一个前 Google 可能跟你问这个话不太合适。本来想问,你觉得问题出在哪里?在一个领导者有 vision 的情况下他应该注意什么呢?

Shuchao:
我觉得有几点啊,第一点呢,有 vision 肯定要比没 vision 强。就如果当时 Google 没有说我是一个 AI company, 就不想做 AI。那其实现在以你的标准来说可能要差很多很多,对吧?而第二点呢,我现在依然觉得 Google 手里的牌是最好。Google 是唯一一家公司,是从底层芯片到 info, 到算法到应用。这一个是世界上唯一一家公司,它整个链条可以做全局优化的公司,任何一家公司都没有现在。他手里的牌依然非常的好。这也跟他 AI first 有关。

然后第二点呢就是就是说认知其实是有颗粒度的。比如说哦我们 all in AI,那怎么 all in AI?怎么就是一个执行一下?就是我们刚才说的 strategy 和 execution 这也是 on top of vision 非常重要的东西。你选一个,肯定选 vision,因为你 execution 再好你没有好的 vision 也是在做布朗运动。

课代表:
这是修身的东西,修身养性就是我作为一个什么样的人我才是一个好的 leader,可是很多同学关注的是法家的东西,就是我做什么,我怎么样子成为那个 leader, 或者说我作为一个 leader 了以后,我应该有什么样的术去做?在这方面可不可以分享一些?我举个例子,我之前采访 Richard, 他讲了几个非常可知性的东西,就是他觉得你华人在硅谷想要做好的话,有几个事情应该做好,一个是 Tech Initiative,一个是 Share Credits,一个是 Network,

有没有这些单本身上的一些想法?

Shuchao:
我觉得我非常同意刚才你说的这几点,比如说第一点一定要非常的 proactive,就是一定要自己去主动的做好事情。第二点是觉得一个人要不停的去扩大他的信任圈,就叫更多的人 build trust,我觉得这样是他的路会越走越宽的。Bill 分享过一个很好的 trust 公式,就是 trust 等于 credibility plus reliability plus intimacy, 然后整个括号 divided by self-orientation,什么意思呢?
Idea
主动才能产生变化,不主动其实就是已经死了,一些复杂的语言隐藏了事实。
就是你的 trust 是根据你的专业领域的 credibility 和你的靠谱程度。你的关系的远近程度,这个三个相加除以你这个人是不是经常会考虑问题的时候是考虑大家还是考虑自己。其实很重要的一点,我跟我团队成员也非常强调的一点一直就是有一个词叫 territorial,就是领地意识太强。我觉得这是一个非常不好的现象,尤其是有很多人可能分不清 territorial versus ownership,就有人觉得把这个主人公精神当成了领地意识其实是不一样的。

我给你举个简单的例子,比如说那里有一块地,就比如说有一亩地,然后 ownership 的意思就是说地是我的,大家可以随便耕,就产出来的庄稼大家评分的或者大家想用的对吧?然后 territorial 的意思就是说,哦,这块地的庄稼只能我种,别人都不能种。其实在公司里面,比如说你站在 CEO 的角度来讲,你会提拔什么样的人?那 CEO 要对谁负责?对董事会和股东负责。股东想要什么?想要公司变得更好。CEO 的目的就是要满足这些需求。那好,那我是 CEO,我会提拔什么样的人?

那这个人是为公司着想的,而不是老是想这件事情对我的这个利益有多大。即使说你 longer term,你说要对我有益,就是说你长期贪婪,短期你也要,哦,什么对公司有益,我要做公司有益的事情,你还能达到你的长期贪婪。所以这是一个非常重要的一点,就是一定要不停的 build trust,那里面 build trust 里面有各种陷阱,比如说 being territorial is one of the trap。

课代表:
我是非常赞同不应该 territorial,然后我是非常同意大家 raise to the top 的,但是我在我的职业生涯中也吃过类似的亏,就是当我非常愿意跟大家合作,然后什么东西都 share 的话,有的 being territorial 的人就会过来侵占你的 scope, 把你的成果据为己有。然后我当时的处理方式可能那个时候还很不成熟,就是如果说你来侵占的话,那我第一我会有一个比较大的反应,让你知道这件事情是踩到我的底线的。

第二呢就是我会 less collaborative,就是我不是跟你做。但是我事后回想这个事情为什么不好, 它其实是降低了整个事情的天花板的。当我把这件事情有了这样一个反应, 且我在这上面投入的资源变少了,它本来能往前走到 100 分, 最后就走到 60 分。那我就拿这个具体的例子吧, 问一下你会怎么处理呢?

Shuchao:
就刚才你说的这个事情挺常见的, 就是如果对方不太好, 怎么办?我的处理方式我觉得不一定是最好的。也有人给我 feedback 说不是最好的处理方式,是看这个人的可取代程度有多高。如果这个人不可取代,那没办法,你只能想办法跟他 work together, 不管是多沟通也好,还是建立某种程度上的信任,然后大家有一个契约。如果这个人的可取代程度很高,就不一定要跟他合作。我的处理方式就是 get rid of this person。

Or I get rid of expressing from my work life.

课代表:
我的处理方式是这个人在这件事情上的可替代程度还好,但是这件事本身的可替代程度还是有的。我这件事情我可以选择去做 100 分和 60 分。我在想就是如果做 100 分肯定对我很有好处,但是我选择去把它做到 60 分也未必是个好事。

Shuchao:
对,如果做事情的话,我觉得还是要事情要做好是最重要的。我觉得事情不做好不是一个特别好的方向。

课代表:
Fool me once,it's your fault.Fool me twice,it's my fault.我 self-reflect 一下的话,我觉得还是自己这个 ownership 不够彻底,我觉得事情的 ownership 不够彻底,所以说这可能也是一个需要改进的地方。Leadership 这方面你还有什么想分享的东西,你觉得想让大家就是 be aware of, 比如说你之前犯的错也好,或者你觉得一些很厉害的人给过你的很好的建议,你觉得很想分享给大家的。
Warning
在这样的循环中永远不会想明白的。
Shuchao:
犯的错,我觉得有一个很好的对于团队的整个的了解非常的重要,一定要知道大家想要什么,就是我觉得这是可能硅谷这边的公司和国内公司或其他一些传统的企业。不一样的地方是硅谷这边的 leader, 他一般要求对两个 party 负责。

第一件事情对公司负责,把公司做好,产品做好,对吧?第二件事情是对团队成员负责,帮助团队成长。其实很多其他公司,非硅谷科技公司可能没有第二条,就是说大家是一个契约,我给你钱,你把工作做好,对吧?所以了解自己的团队非常非常重要。我甚至以前犯过错误去,我以为会 reward 一些团队成员,但是可能这不是他们想要的。

课代表:
我的社区就有人说他要被 promote principle,他怎么样才可以不被 promote? 他现在好苦恼,他不想被 promote。Leadership Principles 聊到这里,最后一个问题关于 Shorts,Shorts 现在做成功了,然后它会是公司长期以来非常重要的地方,就是你的这块田终于长成了一个非常肥沃的田。那你怎么舍得 say goodbye 呢?就是你作为这里边的元老,你在这里边的工作会非常的爽,然后你会不断地收获他的果实。

那你这个时候你选择离开的原因是什么?

Shuchao:
这是一个非常曲折的一个决定,就来来回回可能有一段的时间。其实我最舍不得的可能是团队吧,然后毕竟是一手从零打到的一个团队,而且战斗力非常强,大家的互信也非常非常的强。我离开的最主要原因我觉得可能是我的学习曲线平了。我也大概知道怎么去从零到一 build 一个产品。不管是从产品上、技术上、还是商业上。然后从零到一去 scale 一个比较大的团队。我之前的那个工作可能有三分之一是在 research,三分之二是在做产品相关的东西。

这一波 AI 的兴起呢,使得我看到了很多我觉得更大的趋势。我想更多的去学习。然后把我的学习时间再抖起来,比如说总共是三分之二的 research,三分之一的产品,或者是更多的 research 里面去做。我觉得这可能是促使我离开 Shorts 的最大的一个内因。
Warning
Google宽松自由的环境培养了很多人,但留住人才有很大的缺陷,显然缺一个英雄级别的领导人。
课代表:
那我再问一个更抽象一点的问题。就是 motivating 的是什么?因为我们在预约这个访谈的时候,你也提到过,你现在一周工作是 80 个小时。对很多人来说,他们奋斗的目的是为了不工作,少工作。然后也有很多人,他们哪怕是拿到成果的人啊,他们会觉得自己应该在年轻的时候多打拼,然后得到了成果之后呢,应该更多的去享受收获。当然每个人的 motivation 不一样,所以说我就想问一下,motivate 你,然后你一直想要一个陡峭的学习曲线,

背后的 motivation 和你在中间得到的正反馈大概是什么样子的?

Shuchao:
这个问题非常的好。其实现在人工智能里面没有解决的最大一个问题是,应该给人工智能什么样的 reward? 就是它的目的是什么?这就是一个非常深的哲学问题。我刚好跟我以前的一个 mentor 前两天讨论过这个问题。这个人的 motivation 是什么,你觉得?人的 reward 是什么?

课代表:
伊利亚讲课嘛,他就是说机器想要学习,agent 会 reward itself。但是人其实确实只有一个东西是本质的,就是 existence 和 non-existence。剩下的所有东西都是 corollary。在那之后,就是 existence 和 non-existence 之后,我觉得有一个 default path, 就是我们社会学校会 train 大家去 reward 一个东西,然后这个东西一般是跟 external 相关的,

就比如说你的 status 的这些东西。但是如果说你超越了这个游戏,大多数人其实不超越这个游戏。超越这个游戏以后,每个人的答案就不一样了。我觉得这也是人比较有意思的点就是这个问题没有答案。这其实是纳瓦尔说的,纳瓦尔在应该是周若根的这个播客上说的,就是人的存在的意义是什么?如果这个问题有答案的话,所有的人都可以照着那个意义去 optimize,然后都可以在这个维度上分出高下。之所以人的生命是有意义的,就是因为这个问题没有答案。

Shuchao:
我有一个比较 practical 的答案。从进化论的角度来讲,人的意义就是 maximize 自己基因存在的时间。

课代表:
从基因的角度上是这样的。

Shuchao:
对,因为从进化的角度来讲,不想要优化后代的这个物种全都灭绝了。如果他不想要 reproduce,那这个物种就没有后代,那就灭绝了。所以就是自然选择剩下来的人或者剩下来的物种都是有繁衍的这个目标的。

课代表:
我最近处在一个质疑计划论这个假说的阶段,所以说我可能不会拿它来指导我的哲学思考。

Shuchao:
另外一点就是刚才说的这个学习曲线,其实人的一生也是一个 exploration exploitation 的过程,就是一个 RL 的过程。我觉得计划论也会奖励那些做更多的 exploration 的人,就是 taking risk of learning new things 或者是 practice new things。我发现学新东西会给人带来快感,反正我就觉得很爽,很多时候觉得我实践到了,更新了我的认知,那我的感觉我就非常的爽。

你从一个更偏这个生物学的角度来讲,鸡学习里面的 RL 或者 exploration 跟这个物种的智能是非常正相关的。据说这个小鸡是两周之后就完全成熟了,所以鸡是特别傻的,但是乌鸦可能要好几个月或者一两年,所以乌鸦是要比鸡聪明很多很多的。然后你再看人, 人是可能要 18 年才成熟,对吗?或者是更多年。所以人的智能是非常非常高的,就是因为他经历了那么长时间的探索期。Childhood 就是人类的探索期吗?叛逆其实是一个非常好的事情,因为没有叛逆,人类是不会进步的。
Idea
非常好的描述。
我觉得就是从哲学角度来讲,我不知道为什么可能学习给很多人,或者说我们从小时候的教育也好,或者基因里面 Building 也好。

课代表:
你刚才的那个鸡乌鸦人,你要再说。AI 吗?

Shuchao:
AI 的学习时间很久,所以他……对,这也是为什么我觉得 RL 对于 AI 是非常非常 critical, 所以这大概率是不够能够达到所谓的 AI 赛,或者说能够达到一些…….

    热门主题


      • Related Articles

      • 2025-02-01 Shuchao.2025,AI路往何方?

        Refer To:《2025,AI路往何方?|对话OpenAI 课代表 2/3》。 Shuchao: 我觉得这个 OpenAI 是没有特别好的归代。 课代表: 当有一天 AI 可以开发 AI 了以后,会不会人类就灭绝了? Shuchao: 我觉得很多能力还不存在,并不代表这些东西很难做出来。 课代表: 但是这个东西落到我们的感知上的话,我觉得反而感知也不是那么明显。 Shuchao: Reinforcement Learning 就是我们组合另外一个团队合作做的。 课代表: 你还打算工作 80 ...
      • 2023-09-07 Alphabet Inc. (GOOG) Presents at Goldman Sachs Communacopia & Technology Conference (Transcript)

        Alphabet Inc. (NASDAQ:GOOG) Goldman Sachs Communacopia & Technology Conference September 7, 2023 4:05 PM ET Alphabet 公司(纳斯达克股票代码:GOOG)高盛 Communacopia & Technology Conference 2023 年 9 月 7 日 下午 4:05 ET Company Participants 公司参与者 Thomas Kurian - CEO, ...
      • 2024-10-29 Alphabet Inc. (GOOG) Q3 2024 Earnings Call Transcript

        Alphabet Inc. (NASDAQ:GOOG) Q3 2024 Earnings Conference Call October 29, 2024 4:30 PM ET Alphabet 公司 (NASDAQ:GOOG) 2024 年第三季度收益电话会议 2024 年 10 月 29 日 下午 4:30 ET Company Participants 公司参与者 Jim Friedland - Senior Director, Investor Relations 吉姆·弗里德兰 - ...
      • 2024-07-23 Alphabet Inc. (GOOG) Q2 2024 Earnings Call Transcript

        Alphabet Inc. (NASDAQ:GOOG) Q2 2024 Earnings Conference Call July 23, 2024 4:30 PM ET Alphabet公司(纳斯达克股票代码:GOOG)2024年第二季度收益电话会议 美国东部时间2024年7月23日下午4:30 Company Participants 公司参与者 Jim Friedland - Director of IR 吉姆-弗里德兰 - 投资关系总监 Sundar Pichai - CEO & ...
      • 2025-03-04 Alphabet Inc. (GOOG) Morgan Stanley TMT Conference (Transcript)

        Alphabet Inc. (NASDAQ:GOOG) Morgan Stanley TMT Conference March 4, 2025 1:00 PM ET Company Participants Anat Ashkenazi - CFO Conference Call Participants Brian Nowak - Morgan Stanley Brian Nowak All right. Good morning, everyone. Welcome to day two ...