对话｜王小川：人工智能的奇点2033年就会到来（下）

Original 吴洋洋新皮层NewNewThing 2023-08-02

收录于合集 #对话 3个

「技术发展太快了，需要留点时间讨论」

记者：吴洋洋

编辑：王姗姗

昨天我们发布了对话王小川的上半部分，主要谈他历次创业历程的内在逻辑和对LLMs的终局认知。以下是访谈的下半部分，内容涉及LLM模型开发的实际挑战和AGI的未来技术趋势。

Key Points

（Facebook）他们没有开源，国内所有公司做的大模型，都是自己做的。

与OpenAI相比，现在我们可能还差一步、差两步，差半步是我们的目标。

国内大厂都在发布大模型，但在团队能力上是否离OpenAI越走越近，我们是质疑的。

（百川智能）计划年中推出第一代模型，年底推出对标GPT-3.5的模型。

最后做成的包含大厂与创业公司在内，应该就5家左右。

我们尝试用GPT的AI来训练我们的AI，这样能加速我们的AI发展。

GPT解决的问题是“读万卷书”，AlphaGo解决的问题是“行万里路”。一个深度学习，一个强化学习。

未来，强化学习的比重会大很多，今年可能是5%、10%或者20%，未来可能10倍、100倍的能力要靠强化学习得到。

今天大模型建立人工智能的方式仍然是对数据的暴力美学。

为生命建立数学模型，GPT让这件事更可行。

当下的竞争：谁先做出底层的大模型

新皮层：既要做模型，又要寻找应用场景，先行者已有很多，你怎么排列工作的优先级？

王小川：终局是一回事，当下的主要矛盾是谁能做出底层的大模型，现在没有哪一家能够说自己离 OpenAI很近了。虽然国内大厂也在发，但是离OpenAI的基础大模型还有非常远的距离。没有哪家厂商说能达到3.5的水平，更别说4，也没哪家厂商能拿出一个与ChatGPT同等的产品。

所以今天讨论说市场上会做出怎样一些产品，我认为更根本的问题还是今天谁能够做到一个接近ChatGPT背后的基础模型，以及背后拥有能够追赶OpenAI的一个团队。国内大厂，百度也好，阿里也好，都在发布自己的大模型，但在团队能力上是否能够离OpenAI越走越近，我们是质疑的。

新皮层：外界普遍用算法、算力、语料这些角度来衡量AI项目能不能做成，你觉得这些衡量维度是对的吗？

王小川：还是蛮机械的，最终是人去解决各种各样的问题。讨论算力、显卡只是最简单的盲人摸象般的拆解。

新皮层：如果不是这些维度，你觉得你现阶段最有挑战的事情是什么？

王小川：首先是团队本身是否是有机的，是否有使命、愿景，是否能把团队的能力打造起来，这是最核心的事。今天大家把这件事又变成了是否能把OpenAI里面最明星的人、做架构的人、做算法的人给拉回来做拼盘，这种拼盘方式不是一个有机生命的做法。公司像生命一样是演化出来的，不是拼起来的。更别说那些人愿不愿意回国。

新皮层：人的问题是通过努力招募可以解决的吗？还是市场上能够干这件事的人的总数就不够？

王小川：如果你现在去一口气要做GPT-5，那有这方面整个认知的人才是不够的。

新皮层：特别原创性的、能做算法创新的不够？

王小川：原创性人才不够。你要一步达到今天GPT-5的水平，这种人才特别缺乏，到美国去拉人是一种选择。但另一种人才——对模型有足够认知的顶尖人才零星有一些，能够从国外回来，会使我们比美国那边的大模型能力只差半步。现在我们可能还差一步、差两步。差半步是我们的目标，既不能说我们现在能够立刻追上去，但也不至于说人家已经完成了之后我们才刚开始在干。在这个目标下，我们现在人才努力一下是有机会做到的。

新皮层：舆论认为，中国公司现在能够推出大模型，是因为国外开源了，比如Facebook的LLaMA，还有GPT-3之前的模型。那之后怎么办？

王小川：他们没有开源。开源有两个东西，一个是开它的参数，一个是开它的方法。Meta开的LLaMA模型只是把它的参数公开了出来，并没有公开它的方法。国内所有公司做的大模型，都是自己做的。

新皮层：所以它一定程度上还是黑盒，其他公司能不能做出来还是有风险的？

王小川：对。所以你需要在这里面有自己的探索，他们已经公开的东西，我们可先学习，其他地方我们要去做各种探索。

新皮层：语料这个东西会是一个障碍吗？尤其当你需要做一个落地到特定场景的模型的时候？

王小川：我们首先还是做通用模型，然后逐步演化成垂直模型。所以前期并不需要有特定领域的独有数据。语料在公开领域其实已经足够多了，读万卷书其实有很多语料可以用，难点是语料的治理，就是你选择什么样的数据，不选择什么数据，这种数据的清洗过程更加困难。

新皮层：上一个AI时代，大家普遍认为中国AI的竞争优势之一就是我们有数据，点外卖、打车、网络购物，大模型需要的还是不是这种数据？

王小川：这是两种不同的数据，一种是产品上线之后的用户行为数据，一种是几千年传承下来的知识数据。今天做大模型的话，第一步先要把以前的知识给用起来，中国在这方面并没有特别优势。等产品上线了，用户的反馈数据可以用起来，这时候你才有优势，我们人更多、场景更加丰富。但今天的主要矛盾还不在第二步，现在需要的数据还是对基础人类文明产生作用的那些数据。

新皮层：你计划在年中推出第一代模型，年底推出对标GPT-3.5的模型，这个节奏会不会太快？OpenAI走这段路花了四五年。

王小川：原创确实会更难，但是当你去追赶的时候，速度会快很多，尤其是它已经有产品可以做参考去对标的时候。追赶者会更加容易。

新皮层：所以并不是一个激进的迫于竞争压力做出的计划？

王小川：不叫迫于压力，但也不能说没有这种紧迫感。该不该做到和可行性上能不能做到是两个问题。

新皮层：按这个既定节奏，明年市场就会进入新的竞争阶段？会是对场景的竞争吗？

王小川：我觉得是。如果3.5做到的话，主要矛盾就会转移到对场景本身的理解了。一方面中国市场特别要求对场景的理解落地，甚至后面采用什么商业模式。你做到这一步才会更有机会去追GPT-4或者追GPT-5。OpenAI可以说场景我不关心，我就足够努力去追求AGI就可以。

新皮层：从1到3.5，再到4，对于入场做大模型的公司而言，你认为每一轮迭代大概会有多少的淘汰率？

王小川：我觉得不能用1到3.5到4这样的方式来形容入场做大模型的公司的进度，更应该用做成与做不成来形容，而我觉得最后做成的包含大厂与创业公司在内，应该就5家左右。

技术趋势：

AGI只有GPT还不够，还需要更多强化学习

新皮层：AI技术一直在迭代，GPT所基于的底层技术一定是AGI未来的发展方向吗？

王小川：一定有非常多变化。今天GPT所基于的技术仍然有缺陷，不管它的通用性还是注意机制都不完善，它会忘事，做很多事所需要的经验它也不具有。所以今天GPT解决的问题是把人类已经有的知识学习了，我们叫“读万卷书”。但是之前DeepMind，包括OpenAI都还开发了另外一条技术路径，比如AlphaGo通过下围棋变成了围棋高手，AlphaGo成长到AlphaZero的时候，把以前人类教它的技术都扔掉了，两个机器自己从零开始通过对弈学习下围棋。这是大模型之外完全独立的另外一条路径，我们把他叫做“行万里路”。

新皮层：一个是深度学习的路径，一个是强化学习的路径？

王小川：挺准确的一个描述。深度学习这条路径可以让AI学习已经有的东西，强化学习可以让AI从实践结果里能学到新的东西。

新皮层：两条路径是可以嫁接起来的吗？

王小川：从GPT-3到3. 5，其实已经开始用强化学习了，它给GPT带来了本质的提升，所以在 GPT-4里面可能用得更多。

新皮层：在大模型变得更智能的过程中，强化学习的比重会变得更大？

王小川：对，我的预言是，在未来强化学习的比重会大很多，今年可能是5%、10%或者20%，未来可能10倍、100倍的能力是靠强化学习得到的。

新皮层：如果未来是这个方向，你的团队中对训练机器做强化学习的人才的需求会变更大，而不是开发算法本身的人才？

王小川：今天已经开始变成人训练机器了，怎么去写着instruct，对吧。其实之前OpenAI做ChatGPT的时候，80个人工作了大概3个月，其中40个人是在做调教。未来可能不仅是模型公司的人教它，甚至可能把产品放到应用市场，让更多专业人士甚至用户反馈来调教，就像一个人进入社会，从实习生往上成长一样，这个时代会到来。

新皮层：OpenAI雇佣了大量博士去把一对对QA写下来，让机器学习，这个工作量非常大。中国公司是否低估了这部分工作？

王小川：中国公司并没有低估这部分工作。恰好相反，我了解好多公司在生成这些QA的时候，其实是在利用ChatGPT生成的回答，把这些语料收集下来，作为老师，教自己的AI。所以中国公司好像没有雇佣那么多人，但是这是跟进者的一个快速学习方法。

新皮层：类似于当时斯坦福大学的一位教授用Facebook大模型产生的数据去训练一个小AI吗？

王小川：和AI训练AI是两件事。他是拿一个基础模型去生成一个小模型。不过你确实可以理解为，我们是尝试用GPT的AI来训练我们的AI，这样能加速我们的AI发展。

新皮层：2017年你接受采访回应《奇点临近》那边书提到的“奇点”（指人工智能的智能水平超过人类）概念时说，你认为机器不会比人更聪明，现在你是不是已经改变了这个观点？对于奇点有何新判断？

王小川：当时我低估了技术本身的突破。所以用ChatGPT那一刻，我认为我的想法是改变了的。对于奇点的到来，现在我觉得可能是在2033 年。

新皮层：为什么这么具体？

王小川：人工智能迭代的历史上，第一波专家系统做了40年，学习系统做了20年，深度学习做了10年，时间成倍递减，所以接下来有可能只需要5年，2.5年，1.25年，0.625年……人工智能就开始进入新阶段，这样倒推的话，奇点到来的时间表就是2033年。这是一种美妙的假设，实际上到时候早了或者晚了也不是一个惊奇的事。但是基于技术增长加速，我们有这样的预设。

新皮层：回到最初的问题，GPT对你之前好奇的关于生命相关的问题有些回答了吗？

王小川：搜狗时期我就想知道，通过预测模型是否能够建立强人工智能。当时我想，如果能预测下一帧视频，是不是强人工智能就到来了？我当时有这样一个设想，这个时代其实提前到来了，基于对语言AI的巨大突破。这对我是种鼓舞。

另外，今天大模型建立的人工智能的方式仍然是对数据的暴力美学，这对于未来我们怎么理解数据、理解智能也会有挺大启发。

新皮层：你想要建立生命的数学模型，GPT让你觉得离这个问题有多近了？

王小川：就像无人驾驶一样，这件事情更可行了。

新皮层：复杂理论中对智能的解释是它是一种涌现，你觉得它回答问题了吗？

王小川：还没有回答，就好像说基因决定人，但基因怎么决定人？其实是不清楚的。

-END-

上一篇

若想了解更多当日资讯，请点击阅读往期智能日报：

喜欢就关注我们吧，记得“设为星标”哦~

接下来将更新：

微软VS Google：AI技术的王权更迭

……

与记者交流，可添加微信（请备注公司名称和姓名）：

王杰夫微信号: wjfsty

张司钰微信号: helianthus351

吴洋洋微信号: qitianjiuye

再次，喜欢就关注我们吧，记得“设为星标”

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

“家属和记者取得联系”：记者的退场意味深长

圈内疯传某谣言

不要放过这些人渣

“被指居者”之死：嫌犯身体遭长时间束缚，警方称指居使用械具是惯例

对话｜王小川：人工智能的奇点2033年就会到来（下）

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

“家属和记者取得联系”：记者的退场意味深长

圈内疯传某谣言

不要放过这些人渣

“被指居者”之死：嫌犯身体遭长时间束缚，警方称指居使用械具是惯例

生成图片，分享到微信朋友圈

对话｜王小川：人工智能的奇点2033年就会到来（下）

您可能也对以下帖子感兴趣