查看原文
其他

「梦想机器」简史①:Bush和他的记忆扩展器Memex

张司钰、王杰夫 新皮层NewNewThing 2024-03-08

「想知道微软『梦想机器』概念的起源,看这三篇就够了」


撰写:张司钰 王杰夫

编辑:王杰夫

很多人或许没有意识到,2023年微软Build开发者大会其实是一次萨蒂亚·纳德拉(Satya Nadella)精心策划、颇具雄心(也可以说是野心)的微软回归宣言。「硅谷需要重新找回对微软的恐惧」,知名科技分析师Ben Thompson(本·汤普森)这样警告道。

在5月24日的大会开幕演讲上,这位继比尔·盖茨、史蒂夫·鲍尔默之后的微软第三任CEO提出了「梦想机器」这个概念。在他看来,20世纪初,随着数次科技革命后人类文明的突飞猛进,我们进入了信息爆炸的时代,而为了进一步发展文明,制造一台梦想机器来帮助人类存储、整合与控制信息势在必行。在纳德拉构造的叙事中,微软自然是最新款「梦想机器」的首席工程师,与OpenAI合作的一系列Copilot(智能副驾)产品会成为「人类大脑的蒸汽机」。

不过,本文并不是为了探究纳德拉对于微软Copilot未来的畅想,关于这个主题的文章已经很多,而是回过头来看看纳德拉是如何构造这个「梦想机器」叙事的。正如每个有书写历史野心的人所做的那样,在「追逐梦想机器之路」这张幻灯片上,纳德拉为其绘制了历史年表——从1940年代开始,每十年他都选出了那个年代「梦想机器」的最佳代表,一共8个

图片来源:微软2023 Build发布会截屏

其中后面5个代表因为离今天并不久远,很多科技爱好者都耳熟能详。它们分别是Xerox Alto(施乐奥托电脑,它是第一个使用图形用户界面的电脑,后来也被苹果和微软「借鉴」)、 PC/Server(微软与Windows的辉煌时代)、互联网、iPhone/Cloud(苹果带领的移动时代),以及最新ChatGPT(微软试图再次引领的AI时代)。

而前3个代表事件对于大多数人来说则显得陌生,它们甚至并不是一款产品,而是一篇论文,或是一场演讲。它们分别是:

· 1945年万尼瓦尔·布什(Vannevar Bush)的论文《诚如所思》(As We May think);

· 1960年约瑟夫·利克莱德(J. C. R. Licklider)的论文《人机共生》(Man-Computer Symbiosis);

· 1968年道格拉斯·恩格尔巴特(Douglas C. Engelbart)在电气电子工程师学会的演讲,被后世称作「所有演示之母」(The Mother of All Demos)。

新皮层将会用3篇文章分别介绍这3位科学家和他们的论文/演讲,看看在叙事中的「梦想机器」最初是要满足什么需求,它的雏形是什么样的,以及反观今天我们离「梦想机器」还有多远。


本文将介绍1945年万尼瓦尔·布什(Vannevar Bush)的论文《诚如所思》(As We May think)……


万尼瓦尔·布什是谁?

万尼瓦尔·布什(1890年3月11日—1974年6月28日)是一位美国工程师与科技官僚。早年他的身份更多是工程师,他发明过热熔断器、稳压管以及一台能求解一阶微分方程的微分分析仪。中年后他逐渐开始参与政策制定,他可以被视作第一位美国总统的科学顾问。

图片来源:Wikimedia Commons

他最主要的成就是于二战时期创立了美国科学研究与开发办公室(OSRD),该机构参与了几乎所有的战时军事研发,包括雷达、近炸引信与原子弹,对美国取得二战胜利起到了关键作用。

一直以来,布什强调科学研究对国家安全和经济福祉的重要性,并敦促建立国家科学基金会。他曾写有《科学,无尽的前沿》(Science, the Endless Frontier)一文,建议美国政府大力支持科学研究,政府无需自己设立研究机构,只需提供研究经费供大学和私人企业竞逐,此后美国政府提供的科研经费大幅增加。


《诚如所思》说了啥?

《诚如所思》是万尼瓦尔·布什于1945年7月发表于大西洋月刊(The Atlantic Monthly)上的一篇文章。文章中,布什用六个章节逐步推演其关于Memex产品的构想。其中Memex是memory extender(记忆扩展器)这个两个单词的缩写。这是一个用于记录、存储、组织和浏览个人知识库的设备。

《诚如所思》文章配图,一位科学家用微缩相机记录信息。

在布什的构思中,这还是一个由微缩胶片作为存储载体,由机械传输带作为检索工具,像一个老式办公桌般大小的设备。其实,在布什的设想中并不包含今天我们所认知的数字化的东西,类比来看,他提出的Memex有点像是二十年前在中小学流行的投影仪,再加上一个可以用来整理和检索的幻灯片夹子。

《诚如所思》文章配图,Memex构想图。

不过,考虑到1946年2月14日世界上第一台通用计算机「ENIAC」才在美国宾夕法尼亚大学诞生,它用电子射线管来运算,是一个占据好多间屋子的庞然大物。而今天我们认知的,可以放在桌面上的小型计算机直到1964年才由IBM System/360实现。他的Memex设想在当时可谓非常「超前」。

布什是最早以增强人类智力为目的来构想出一套设备和解决方案的人,Memex也因此被视作启发了超文本与互联网等技术。2001年,微软还曾提出一个MyLifeBits项目,希望复刻布什当年提出的Memex,用信息化的方式记录人的一生,实验对象是当时微软旧金山实验室的首席计算机科学家Gordon Bell。

此外,在文章中布什还对Memex推出后人类工作可能发生的变化做了预判,包括不同职业工作方式的变化、新职业的诞生等等,其大部分分析直到今天依然成立。这也与如今生成式AI冲击下,每个打工人的感受非常相似,形成一种历史层面的呼应。


章节概括

引言

这一部分布什主要讲述了当时科学家们所面临的新挑战,为他在后面提出Memex交代了时代背景。

科学为人类个体提供了最快捷的交流方式,但是研究者正面临困境。一方面,研究发现过多,导致他们没有时间理解记忆,学科之间的联系没有得到充分发展;另一方面,概括方法过时,导致研究者错失重要研究成果,即使尽力跟上最新的思想成果,也可能难以回顾几个月前的阅读内容。

过去由于成本和可靠性等问题,许多工具没有被广泛采用。然而,现在人们能够生产出复杂而可靠的仪器,如打印机、电影摄影机和汽车——现代的工具和技术使人们能够以不同的角度观察事物,记录和观察未曾见过的现象,帮我们更好的理解科学资料。

那么,是否有工具可以更高效地传递和利用现有研究成果呢?为此,布什先提出了以下两个构想:Miniature Camera(微型相机)与Speech to Text Machine(语音转文本机器)。


章节一

这一部分布什聚焦在摄影技术发展如何使科学记录变得更便捷、高效,布什提出了第一个设想:「Miniature Camera(微型相机)」,以期能够在更小的空间里存储大量的信息资料。

一直以来,人们有存储、查询对科学有实用价值的记录的需求。目前我们主要通过书写、摄影和印刷等方式记录,同时也使用胶片、磁盘和录音磁线等方法。

不过得益于摄影技术的不断进步,未来的摄影设备、摄影技术可能会为信息的存储提供新思路比如在未来:利用微型相机可以拍摄微小尺寸的照片,且触发快门的方式更加便利;干法摄影技术可以使胶片在不需要冲洗的情况下成像,提高处理速度;发光屏幕替代胶片可以展示连续画面;缩微摄影技术可以在材料被不断放大后保持画面清晰完整。

总的来说,未来记录和存储技术将更加便利和高效,大量的信息可以被记录、存储、查询和传输。不过,缩微摄影技术的发展也要经历一个较为漫长的过程,其技术的局限性表现在胶片的晶体颗粒、光学系统的性能以及采用光源的效率上,并且,压缩成本也应被纳入考量。


章节二

这一部分布什提出了第二个设想:随着机械化发展,「Speech to Text Machine(语音转文本机器)」正在变得可能,输入的过程也可以被机器取代。此外布什论述了四则运算将会被机器替代。

未来的作者可能不再需要手写或打字来记录文字,而是可以通过口头语言直接记录文字,并利用现有装置将语言转换为文字。

有一种名为Voder的机器,在没有人类参与的情况下,它可以通过电产生的振动发出可识别的语音。贝尔实验室有这个机器的相反版本,称为Vocoder,它通过麦克风接收声音,并将其转换为键的移动。此外,还有一种称为语控防鸣器的仪器,可以记录演讲内容,并将内容转化为普通语言打印出来。这种仪器结合声码器控制速记机,即可以创造一种通过口头交流打字的机器。

不过,我们现在使用的语言并不特别适应这种机械化过程——可惜的是,通用语言的发明者也没有考虑到这一点并创造出一种更适合「语音转文本机器」记录的语言。不过随着技术的发展,这个困难应该会被克服。想象一下,未来的研究员可以在白天利用机械辅助工具观察和记录,在晚上通过连接录音设备,说出自己的思考并迅速记录。

值得一提的是,算数、统计、具有重复性的操作过程等基本重复性思考可以交由此类工具辅助。但对于审慎思考而言,不存在机械替代品。


章节三

主要衔接章节二的内容。布什在前一章节论述了四则运算过程可以被机器替代,那么这两章节则补充提及,不局限于算数领域,只要是重复性的思维过程,机器就能发挥很大的作用。

当根据既定的逻辑过程记录事实时,思维的创造性仅体现在数据和方法的选择上,之后的操作具有重复性的性质,这些都适合交给机器处理。目前已经有不少复杂的机器,比如解决微分方程、函数方程和积分方程等问题的机器。还有许多特殊的机器,比如可以预测潮汐的谐波合成器。

但是目前受经济因素影响,即市场不够广、商业需求不够强,此类机器多掌握在科学家手中。但随着生产方法的提升、商业需求的增长,未来这类机器一定会大规模生产的。因此,我们人类需要接受,而非排斥,用机器来处理问题。

但只有人类将其他事务也放心交给机器处理,就像将汽车的推动交给车内复杂的机制一样,只有这样,数学才能在化学、冶金和生物学等高级且实际的问题解决中发挥作用。基于这样的需求,未来将会出现更多处理科学家高级数学问题的机器。


章节四

紧接上一章节,布什用三段继续阐述未来机器的潜在能力,即一种更高级的机器不仅可以处理数据,也可以处理逻辑问题。在布什看来,用机器存储和记录已经在前几章节说清楚了,接下来一个更棘手的问题是如何有效检索信息。对此他构想了一种可以用来检索的机器模型。

此外,科学家并非唯一通过逻辑思维操纵数据和观察世界的人,重复性的思维过程并不仅限于算术和统计方面。除了高级数据分析外,普通人也可以使用机器辅助工作——每当思维在一段时间内按照既定的模式进行时,机器就有机会介入,并且能够根据逻辑法则得出结论。

对于思想的操纵和它们被记录下来的处理就说到这里。接下来的问题更加棘手,因为我们可以极大地扩展记录;但在现有的庞大数据中,我们几乎无法进行有效的查询。这个过程说起来简单,逐个检查大量项目中的每一个项目,并挑选出具有特定指定特征的项目。目前我们还采用机械的方式来检查,这太慢了。

让我们以百货公司遇到的问题作为例子。每次销售时,有很多任务需要完成,包括减少库存清单,为销售员记入销售额,进行总账记录,最重要的是需要向顾客收费。目前已经有一种中央设备可以完成这些工作,销售员将顾客的身份证、自己的卡片以及售出商品的卡片(都是穿孔卡片)放在一个支架上。当他拉动一个杠杆时,通过穿孔孔洞进行接触,位于中央位置的机械设备进行必要的计算和记录,并为销售员打印出适当的收据,以便交给顾客。

但假设有一万名顾客需要交易呢?这就需要对机器做升级。卡片可以用前面提到的干燥摄影技术来完成,用光电管来快速读取,用电子束来记录;卡片需要是微型的以便于快速移动。通过这些方法可以将检索速度加快成百上千倍。


章节五

这一部分可被视为全文的核心篇章,布什将前文提到的所有设备统合到了一起,提出了一台名为「Memex(记忆扩展器)」的设备,它用微缩胶卷来存储信息,用语音转文本机器来输入信息,并且具有快速检索的能力。

图书馆目前在选择和获取记录方面存在一些问题,其中索引系统的人为性是主要原因之一。比如,索引系统以字母或数字的顺序进行归档,并通过追踪子类来查找信息,这在定位和访问项目时可能会产生繁琐的规则和限制。

与索引系统不同,人类思维通过联想运作,通过跳跃和关联思考来找到信息。人类思维的速度、路径的复杂性以及心理图像的细节展示了思维的强大能力,不过,不经常被追踪的路径容易消退,项目并非完全永久,记忆是短暂的。

虽然机械化的选择和联想过程无法与人类思维的速度和灵活性相媲美,但可以通过机械化的方式提高存储和检索项目的持久性和清晰性。

正因如此,未来的个人设备可以扮演机械化的私人文件和图书馆的角色,其中个人可以存储所有的书籍、记录和通信,并以高速和灵活性进行查询。这个设备被称为「Memex」,它外表是一个有着半透明屏幕、操作杆等组成的书桌,通过微缩胶卷来储存信息,我们可以用它来检索、浏览和记录。

Memex的核心特点:通过一个机制,使任何项目能够立即且自动地选择另一个项目,将两个项目联系在一起的过程至关重要。因此,除提供按照常规索引方案记录、查询功能外,用户可以将一个项目保持在指定位置的同时调用另一个项目,并且可以随时在其中添加边注和评论。


章节六

这一部分是全文的总结。前文中布什论述的三个设想共同催生了一种全新形式的「百科全书」,那么科学给我们的生活、工作带来哪些改变?这是本章节主要介绍的内容。

全新形式的百科全书将会出现,律师、专利律师、医生、化学家和历史学家等专业人士可以通过Memex获取与他们工作相关的丰富信息和线索。

比如,律师轻触屏幕,即可获得与他丰富经验、朋友和权威意见相关的法律观点和判决;医生面对患者反应时的困惑,可以通过追溯之前类似病例的线索,快速浏览类似案例历史,并借助经典文献获得相关的解剖学和组织学知识;化学家在努力合成有机化合物时,实验室中的Memex给予他无限的化学文献资源,可通过追踪化合物的类比关系,查找与其物理和化学性质相关的线索;历史学家拥有一份详尽的民族年表,他可以通过一个跳跃的线索,仅停留在重要的事件上,并随时追踪与某个特定时代相关的当代线索,带领他穿越整个文明。

同时也将诞生新的职业——开拓者,他们乐于通过庞大的记录建立有用的线索,使整个记录对于后来者而言成为一座完整的脚手架,让后来人可以基于这些记录更方便的开展研究。

由此可见,Memex将成为一个无限的资源库,为各种职业提供记录和知识的存储和访问。通过更好地回顾和分析记录,人类的思维可以得到提升,并可能更有效地探索和创新。科学可以改变人类制作、存储和查阅记录的方式,但仍存在技术困难和未知的潜力。在正确运用机器以实现人类的真正利益之前,也可能导致冲突和不幸。



英文原版参考链接:

https://web.mit.edu/STS.035/www/PDFs/think.pdf

-END-



我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为“高级智能”的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的是智能,不只是AI。



若想了解更多当日资讯,请点击阅读往期

智能晚报|智源发布悟道3.0系列大模型;微软或将亚洲研究院的AI人才搬到加拿大;苹果可能正在开发低价版Vision头显...

若想了解大公司资讯,请点击阅读往期

大公司|Meta全员会,扎克伯格说Apple Vision Pro没什么突破性创新



与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye


再次,喜欢就关注我们吧,记得「设为星标

 



继续滑动看下一个

「梦想机器」简史①:Bush和他的记忆扩展器Memex

张司钰、王杰夫 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存