查看原文
其他

ChatGPT很火,它能取代搜索引擎么?

Super黄 Super黄的念想 2024-01-18

近日,一款名为ChatGPT的聊天机器人引起了广泛关注。许多人开始猜测,这款聊天机器人是否有可能取代搜索引擎,成为人类获取信息的新途径。那么,ChatGPT究竟有多厉害,它真的能取代搜索引擎吗?在本文中,我们将深入探讨这一问题,并给出我们的答案。

为了让我们的讨论更具有参考价值,我们来看一些实际案例。例如,有一名用户想要查询有关“本周末天气预报”的信息,他可以通过聊天机器人ChatGPT轻松获取答案。同时,如果用户想要查询更为复杂的问题,比如“人工智能未来发展趋势”,ChatGPT也能通过它的深度学习模型为用户提供详尽的答案。

这些案例表明,ChatGPT具有很强的智能化能力,能够满足用户对信息检索的需求。

以上这段话,是我让ChatGPT写的,是不是真的很强?

今天我想写一写自己的一些思考,对于ChatGPT能否取代搜索引擎,分为这么几个点:

  1. 俞军怎么说?
  2. 理解搜索引擎
  3. 理解推荐引擎
  4. 内容为王?
  5. 一种可能性

01 俞军怎么说?

我们可以看一下俞军的思考:

---

对于 ChatGPT 会不会取代掉搜索引擎,俞军老师是这么看的(授权转发):

「要看他这里“取代”的具体定义是什么。

颠覆Google,成就一个新的互联网大厂,这个是不可能的。

搜索引擎,从PC互联网早期的简单内容分析算法,然后PC互联网大发展过程中,Google凭超链分析算法崛起(因为互联网链接爆发式增长),要说超链分析颠覆了内容分析,基本是可以的,虽然也是继承式超越的关系。

再往后,PC互联网后期,超链之外,也逐渐利用用户点击数据。而到了移动时代,用户数据大发展(正如当年的PC互联网超链大发展),这促成了推荐引擎的崛起,也成就了字节这样的奇迹,推荐引擎到处普及。但是,如果要说推荐引擎颠覆了搜索引擎,显然也不成立,只是分流走了不小的搜索需求,更抢走了大量用户时间。

从某个视角,我会认为这个顺序并无违和:内容分析---超链分析---推荐引擎---“语义分析学习+智能交互”。数据和技术两方面的积累都到了新的临界点,新技术就开始进入大众视野,应用开始普及。

ChatGPT当然是了不起的东西,能在多少细分领域发挥巨大作用,现在是未知的,演化才刚刚开始。我个人认为,它更是一种基础技术,像推荐引擎一样会被所有需要它的大小公司应用和摸索,这其中很难出现Google这样天然一家独大的平台,可能也很难出现字节这样一路惊艳打出来一个领先平台

尤其是中文互联网,会更失落一点,因为,除了移动时代相对PC互联网时代的公共内容快速下降、APP割裂封闭,还因为大环境急剧变化,以后没有人写内容了(除了金钱导向的职业内容生产者)。当文字内容缺乏更新,无源之水,中文语义分析的进步或许会被拖累。」

---

备注~以上转自刘飞的即刻贴:https://web.okjike.com/originalPost/638ffbb9bd99cdb26cfb9606

俞军的话中,有几个要素,咱们可以拆开来理解一下:

第一. 搜索引擎关键技术在于超链分析:PageRank,也就是评估不同网页之间的价值,并给予权重,这造就了Google、中国的百度。

第二. 推荐引擎是第二个颠覆式的技术,在进入移动互联网之后,用户大数据的崛起加上个性化推荐,造就了字节跳动。

第三. ChatGPT很牛逼,不过刚开始演化,更加像是一个基础技术,会被所有公司应用,很难打出一个领先平台。

02 理解搜索引擎

Google 1998年正式注册公司,使命很简单直接:“组织世界各地的信息,并使其普遍可访问和有用。”

Google因为搜索技术好,起步早,前期通过toB的模式获得收入,2000年开始成为雅虎的搜索引擎提供商。2002年引入了AdWords(按点击付费的第三方广告平台),2003年又进一步推出了Google AdSense,在自身流量商业化上实现了飞速的进展。

并且自身也推出了大量的产品:

  • Google Maps(2005)
  • YouTube(2005年)
  • Google Earth(2005)
  • Google Calendar(2006)
  • Google Finance(2006)
  • Google Streetview(2007)
  • Google Android(2007年)
  • Google Chrome(2008)
  • Google Voice(2009)
  • Google Labs(2012年)

逐渐的,Google承担起了某种角度上的中心化分发的角色。

百度呢?

整个崛起过程也有点类似。

但是国内的环境会更加复杂一些,2000年1月1日,李彦宏成立百度,靠ToB收费启动,网易、新浪、搜狐等国内门户霸主是百度的重要客户。

(百度早期的首页)

2001年8月,互联网泡沫之下,百度推出自己的独立搜索服务网站,并且上了竞价排名机制。

2002年11月,百度上线MP3功能 2003年12月,百度贴吧上线 2005年6月,百度知道上线 2006年4月,百度百科上线

另外,早期的中国网吧里,浏览器的首页几乎都是一个黄页:hao123。2004年8月,百度出资5000万人民币,加一部分百度股权,收购了hao123。


所以我们回看两家搜索引擎公司,有一些共同的特点:

首先,是早期在没有足够流量和变现模式下,都依赖ToB提供技术服务来获得商业收入; 

其次,都是通过流量来获得广告变现,不管是竞价排名还是Google AdSense; 

接着,都会去构建内容生态,来增强中心化的能力。(这一点非常重要,加粗,后面会考)


Google由于直接面对全球(英文),美国风投也更加成熟,所以流量崛起要更快,百度则困难一些,通过收购Hao123,提供盗版MP3搜索,一些边缘内容搜索提供,以及自建内容生态(贴吧、知道等等),逐渐获得崛起。

用户为了获得信息,来到中心化的搜索引擎,输入query(搜索词),搜索引擎将结果返回,其中掺杂广告。用户获得信息、平台获得收入,商家获得流量。

这是基本模式,搜索引擎通过巨大的流量,获得商业收益。

03 理解推荐引擎

今日头条的崛起,和推荐引擎是有强关联的,但也不是唯一因素。

推荐引擎能够做到,千人千面,无限信息流,保证了用户的优秀体验,但这不构成绝对的护城河。

有这么几个因素:

首先,快速增长

基于绝对的数据理性,今日头条做了这么几个动作:

  1. 渠道投放
  2. 手机预装
  3. 微信分享

现在看这几件事是家常便饭,但在早期,存在巨大的红利。

比如预装彼时的价格只需要5毛到1块。

比如早期微信生态对于分享裂变并没有严格限制,今日头条首先采用了点开网页只能看一半内容,下载App才能看到完整内容,这种引流效果之好,对没有受过“荼毒”的用户来讲,效果实在太好。

其次是,内容爆发

今日头条没有一个编辑,不生产内容,使用技术手段抓取媒体新闻。。。

直到2014年,今日头条还在被全国媒体围殴。新京报网、搜狐网、《广州日报》、《楚天都市报》等媒体,都曾因版权问题与今日头条开战。他们愤怒,自己辛苦创作那么多年,才那么点用户。而今日头条毫不费力把这些拿去,换来了大把流量。

2015年,今日头条推出“千人万元”计划和内容创业孵化器,第二年头条号总数就从3万迅速涨到30万,翻了10倍;2016年砸10亿元扶持短视频创作者,今日头条就成了仅次于快手的第二大短视频软件。

同时,海外战略快速推进:

2016年5月,今日头条上的视频消费总时长,已经超过了图文。张一鸣当即决定all-in短视频。

2017年6月,头条视频更名为西瓜视频。同时抖音开始有燎原之势,今日头条的短视频矩阵逐渐清晰。从内容上看,西瓜视频对标秒拍,火山小视频对标快手,抖音对标美拍。

《TikTok内幕:张一鸣的巨浪征途》中有过这样的描述,早在今日头条发展早期,张一鸣就已经预见了今日头条的未来。

在字节跳动内部流传着这样一组估算数据:整个中国资讯信息流市场,日活总规模可达2.4亿左右。假设行业第一名分走一半市场的话,那么今日头条的日活上限约1.2亿左右

不管是悟空问答、头条搜索还是微头条,今日头条做的很多尝试都没有很好的效果,去年11月,字节跳动公司将旗下的今日头条、西瓜视频、搜索等业务正式并入抖音

所以,字节真正的突破,来源于短视频。

接着,推荐引擎

推荐引擎,基于用户兴趣,做内容分发,保证用户在产品上消耗最多的时长,更好的留存,平台也就获得最多的流量,做到的是流量最大化。

这里,推荐引擎也完全是中心化的,我们打开抖音,能刷到的信息源,都是字节系的内容。

04 内容为王?

刚才我们简单聊了搜索和推荐,他们的背后都是内容的分发。

搜索是从用户的query出发,基于PageRank排序分发内容;推荐是从用户的兴趣出发,基于标签等算法匹配分发内容。

前者通过爬虫抓取互联网海量网页,后者通过站内生态打标签。

搜索的没落来源于越来越多的App削减了公开的网页内容(但依然强大),推荐的限制在于限于巨头内部的生态。

我在《微信搜一搜,后发大杀器》里,阐述的观点是,搜一搜之所以可能后发,核心在于13亿月活的巨大社交用户,公众号+视频号,构建内容,小程序平替App,底层还有微信支付等支撑,使得微信生态逐渐强大。

因为微信常驻前台,是我们打开最为频繁的软件,所以它很容易在我们需要的时候被唤醒,对于解决用户需求这一点上(微信不光解内容,还额外能提供服务),捷足先登。

单纯从内容的角度,ChatGPT本身就已经基于海量的互联网数据,从理解用户语义的前提下,直接给出用户想要的内容,为何不能替代搜索引擎,以及推荐引擎呢?

当然,现在还没有达到真正的替换水准,有大量的限制:

比如,ChatGPT只能给出训练集内的内容;比如,运行一次成本较贵;比如,对一些复杂问题含混过关;比如,会被人类的反馈调教的内容跑偏;比如,ChatGPT只是给出单一答案,存在用户没有选择的问题。。。

但是,ChatGPT只是GPT3.5的副产物,大家都在期待着GPT4出来后的惊艳!

当前存在的问题,不意味着下一步不会很快的就解决掉。

比如:

Twitter 用户 An Qu 开发了一款新的 Chrome 插件帮助 ChatGPT 上网,安装插件以后 ChatGPT 就可以联!网!了!

还有很多人会用各种方式解决ChatGPT出现的小问题。

再比如,ChatGPT只是给出一个单一答案,无候选,其实它也可以多次生成内容:

对于GPT来讲,存在Prompt和随机数两个参数来生成内容,不同的随机数则可以生成不同的内容,只要单次内容生成时,同时触发多个随机数,就可以给出多个答案了。

这里面优化,甚至可以从多个角度给出答案,保证视角的多元。

05 一种可能性

可能会在未来某个时刻,我们可以在手机本地生成所有的互联网海量数据

背后的原理是,把生成算法和潜空间,直接存在本地,每次我们往手机里丢关键词,手机直接在本地生成对应的内容,这样,我们甚至不用联网就能获得想要的内容了。

比如,想搜索家里常备的药物,其实本地就可以直接给出答案了。再比如,你想写一篇GPT能否取代搜索引擎的文章,也完全不用上网。还有,你想看一条恐龙演变史的视频,本地也直接生成了。

如果到了这个阶段,搜索引擎实质上已经被替换掉了,还有存在的意义么?

还是有的,毕竟互联网帮助我们获得实时的信息。

另外,我们也需要警惕,下面的图就充分阐明了这一点:

俞军最后也说:当文字内容缺乏更新,无源之水

技术是为了帮助人类进步,不要让它毁掉人类进步。

对于ChatGPT,你有什么看法呢?

继续滑动看下一个

ChatGPT很火,它能取代搜索引擎么?

Super黄 Super黄的念想
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存