其他
行业专家答12个关键问题:中国AI产业发展需要突破哪些瓶颈?
编辑丨郭晓静
文字整理丨赵杨博丨划重点●ChatGPT用户访问量和用户增长速度已经超过了以往的技术革新的发展速度,确实有可能影响到搜索引擎的历史地位,但时间需要多长?还要看ChatGPT的迭代速度以及能否解决它自身的缺陷。●ChatGPT存在“一本正经胡说八道”的现象,这种现象的学名叫:幻觉性。这种现象并不仅存于GhatGPT,而是AI大模型的“通病”。●中国市场的数据体量足够大,只要愿意付出相应的成本,数据质量也不是不能解决的问题,反而像数据归属、数据安全、数据隐私等等是需要重点攻克和解决的问题。●ChatGPT可能不是技术原创性突破,但是是集合了底层技术的工程、模式以及产品的应用创新。01
“大力”出奇迹,
但有一个目前无法治愈的“疾病”谷歌高级副总裁兼谷歌搜索引擎负责人普拉巴卡尔·拉格哈万(Prabhakar Raghavan)在接受采访时表示:“机器以一种令人信服但完全编造的方式来表达自己。”这就造成了我们经常调侃的“一本正经地胡说八道”。02
ChatGPT的流畅对话来自于
预训练模型计算机之父及人工智能理论先驱艾伦·图灵在1950年就做过如下假设,在一台机器拥有无限的计算力与储存条件的情况下,“计算机是否能够思考”就并非一个技术层面的问题,而是一个哲学问题,而解决它的关键在于如何定义“思考”。因此,他将“计算机是否能够思考”这个问题转换成了“计算机是否能够模仿人类,”并由此提出了如今被称为“图灵测试”的思维实验,他认为,如果人工智能能够成功模仿并骗过提问者,这证明计算机能够思考。我们问ChatGPT,你是否通过了图灵测试,它自己回答:“我并没有通过图灵测试”。然而,很多人都更坚持认为,它已经通过了图灵测试,它回答问题的流畅度,已经让你经常忘记自己在和一个机器人交谈。ChatGPT为何更像人?03
大规模预训练技术仍处早期探索阶段
人工智能公司还需耐心打磨当ChatGPT带来的新鲜劲儿过后,大家对它的“一本正经”的胡说八道提高了警惕,尤其是经常出现逻辑错误和做错数学题。谷歌的Bard被寄予了厚望,然而,Bard仅仅回答了一个问题,就已经被发现了常识性错误,发布当天,谷歌的市值也跌去了1000亿美元。Bard真的比ChatGPT差吗?模型之间的好坏,究竟由什么决定?04
ChatGPT迭代了搜索引擎的体验,
有些行业将迎来全新挑战Gmail的创始人Paul Buchheit2月2日在推特上表示,ChatGPT将像搜索引擎杀死黄页一样摧毁谷歌。随后不久,Paul Buchheit又发推,继续补充“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即使后者跟上了人工智能的发展,也将导致其业务中最能赚钱的部分大不如前!” 在哪个行业最先被ChatGPT颠覆的讨论中,搜索引擎首当其冲。Q9: 搜索引擎会被颠覆吗?张鹏: 首先我们可以从搜索引擎的本质和ChatGPT的本质来进行区分。搜索引擎的核心使命是用户去获取所需的信息,它的工作方式是被动方式,用户必须先将自己需要查询的内容输入搜索引擎,从而返回相关的信息,过去将近20年,搜索引擎技术的发展目标主要是提高用户查询和反馈结果之间的相关性。对于简单的查询,搜索引擎可以处理的非常好。但稍微复杂的语义或者说包含逻辑的查询,搜索引擎是做不太好的。而ChatGPT解决的不是被搜索的信息与用户查询之间相似度的问题,而是一种从自然语言角度来看,怎么来解决上下文的一致性、流畅性和逻辑性的问题,是以另外一种视角来看待信息获取。所以它是一种全新的交互方式,更便捷、更友好,能够帮助用户直接解决问题,比如以写问题的方式去做文章总结、写文档、编程等等,相当于在搜索引擎的基础上又前进了一步。根据统计数字,2023年1月份ChatGPT全球访问量已经达到六亿多次,一个月内就达到了一亿用户,这对于传统搜索引擎来讲是巨大的挑战。这种用户访问量和用户增长速度已经超过了以往的技术革新的发展速度。确实是有可能会影响到搜索引擎的历史地位,但需要多久的时间?还需要等待ChatGPT的迭代速度以及能否解决它自身的缺陷,比如幻觉性的问题。Q10:Model as a Service(MaaS)未来是否会替代SaaS?张鹏: MaaS其实是一种全新的技术和市场理念,是基于当前AI大模型技术发展到一定水平之后一种新的技术应用形式。MaaS的目标其实是将模型的各项能力进行简单通用的封装,以提供API接口的方式向用户提供AI赋能的能力。一般来说用户需要在MasS的基础上做二次开发和系统功能集成。但一般情况下SaaS是指,在线上通过云服务的方式向用户提供业务和功能性比较强的软件服务,所以重点是在于软件功能和用户业务的满足性。一般户可以直接使用,不需要做开发和集成。从本质上来说MaaS和SaaS处于信息服务生态的不同层次,理论上来看MaaS的出现是对SaaS服务的有益补充,可以让SAAS服务的开发成本和周期降低,同时智能水平更高。Q11: 从产业上看中国数据标注能力很强,但数据质量上存在差距,差距在哪?张鹏: 我觉得数据质量可能不是最关键的问题。我相信中国市场的数据体量足够大,数据质量也没有想象中那么严重。只要愿意付出相应的成本,数据质量也不是不能解决的问题。反而像数据归属、数据安全、数据隐私等是重点问题。尤其是数据归属和安全问题,有很多实际案例。AIGC绘画前段时间被热捧,但是AI生成的绘画,其实使用了很多人类画家、画师创作的图片进行训练,但在版权上没有进行确认。所以在利用数据资源的过程当中,除了数据的标注加工,在这个过程其实大众应该把注意力放在数据服务方面。包括数据归属安全的问题。如何在法律、道德等层面对事情进行明确的划分和管理。比如不得不使用未经授权的非公开的数据;还比如对于大量的社区或者志愿者提供数据可能需要有一定的信用体系去保证。Q12: 我国的AI企业,未来最靠谱的演进路线应该是怎样?张鹏:人工智能发展的三大要素:算法、数据和算力。但其实并不意味着每个企业都要投入巨大的算力成本去做模型的训练和部署。其实 “大”模型,这个“大”,其实就是希望能集中使用算力。大企业有能力投入算力资源,构建出模型,并做出AI平台。中小企业其实可以对平台按照用量付费,算力投入成本及研发投入时间都会大大减少。这其实可以被称为AI发电厂的一种模式。另外,AI大模型本身的压缩和优化也是重要的研究方向。随着芯片技术、大模型技术的不断发展,成本会不断降低,效率会不断提高。至于演进路线,首先需要承认我们落后于人,要向最先进的方向去追赶。其实不用太纠结于某些地方被限制,这都是大家都知道的事情,总会有解决办法。中国不缺人才,不断地努力,肯定有追上的机会。别人已经做出了现成的东西,我们可以去学习,但是在这个过程当中不能完全照搬他人经验,别人也未必会把经验全部告诉你,所以这个过程当中还需要赋予自己的思考、想法与创新。推荐阅读
OpenAI给科技行业敲响警钟,中国必须要有自己的“大模型”
未来指北系列
人形机器人一定要有两条腿吗?
创投变辩辩系列02期