首页 智能机器人 人工智能会抢哪些工作

  第四章 信息技术

  在本书的第一部分里,我们基于第一手研究和其他人的书面作品,为大家罗列了专业工作正在面临各种变化的证据,但是我们并没有深入探讨这些变革的原因。这正是我们在第二部分里希望达到的目标。我们希望为正在发生的情况提供全面系统的解释。我们即将提出一系列理论和模型,用于解释之前所发现的那些证据,再帮助我们预测接下来还会发生什么。

  本章一开始我们会聚焦在社会的“信息基础”上,研究过去它是如何影响人类分享实践经验的方式的,以及未来它将如何产生作用。接下来我们会研究技术,讨论制定预测的价值所在。此处的结论将帮助我们探索未来技术的四个重大发展方向。在本章最后部分,我们将介绍过去几十年技术的变化对专业工作所带来的影响,这将成为下一章的基础:在第五章里我们将探讨知识的本质、专业工作的进化发展,以及那些将要取代传统专业方法来创造并传播实践经验的模式。

  4.1 信息基础

  在日常对话中,人们使用技术这个词汇多过信息技术和IT。对于技术的偏重是可以理解的,因为技术在我们日常生活中所带来的成就是非常显著的。从设计层面到它们所拥有的实力,技术都拥有超凡的魅力,我们也自然会感叹于技术创造者的天赋和心灵手巧。但是仅仅对技术表示关注而忽略了信息这一层面,可能会忽视信息的角色和价值,对整个世界都是如此,对专业工作来说更是如此。

  社会的信息基础可以为我们在专业工作领域观察到的或者预计将要发生的变化提供一种合理解释。这个词汇是指信息存储和传递的主流方式。这里所指的信息比较宽泛,包括一系列相关概念——从信息链一端的原始数据涵盖到另一端的知识和经验。以沃尔特·翁(Walter Ong)在《口头文化和写字文化》(Orality and Literacy)中的观点作为起点,我们提出人类社会的信息基础模式经历了四个发展阶段。基于此,我们认为在不同的阶段,社会的信息沟通分别依赖于口述、手稿、印刷以及信息技术。我们所关心的重要问题是社会的信息基础在何种程度上影响了实践经验的供给,它们如何被创造出来?如何得到分享?谁可以接触到并理解这些内容?我们的假设用于存储和传递信息的系统,对于实践经验的创造和传播有着重大影响。更准确地说来,信息基础,通过某种不明确的机制,决定了实践经验的数量、复杂程度、来源、获取便利度、更新的频率,以及可以对信息进行可靠应用的人类和其他系统。关于信息与通信系统发展历史的相关文献,包括人类学和社会学,都确认了这一观点。简而言之,我们认为信息基础对实践经验的创造和传播活动产生着深远的影响。

  我们接着深入探究信息基础在这四个发展阶段——口述、手稿、印刷以及信息技术中的影响,希望借此对专业工作以及其他领域未来的潜在发展趋势做出预测。

  大多数专业人士受邀评论人类从手稿时代到印刷时代的进步时,他们迅速根据直觉承认知识的组织方式在这一转变过程中发生了巨大改变。如今我们正处于从印刷时代转变到信息技术以及互联网时代的过程中,这时专业人士却似乎不那么愿意承认类似的情况正在重新上演。为了帮助大家理解这些变化,接下来我们针对每一个阶段展开分析。

  4.2 前印刷以及印刷时代

  当我们在电脑前弯腰弓背、在平板上指指画画的时候,很难想象一个没有手稿、印刷和信息技术的社会,也就是所谓的口述时代。沃尔特·翁曾经形象地指出:

  受过文化教育的人必须费很大的力气,才能想象出依靠口述交流形成的文化是什么样的。也就是说,一种完全不懂书写或者完全不知道书写为何物的文化是什么样的。尝试想象一种文化——从来没有人“查阅”过任何东西。在口述文化里,“查阅某个内容”是一句空话,没有任何实际意义。没有书写形式,单词都没有视觉上的存在形式,即使它们所表达的对象在视觉上是存在的。它们只是声音。

  如今,我们查询信息的习惯已经深深地受到互联网的影响,很难想象一种无法随手查阅信息的生活方式。借用沃尔特·翁的思想来表达,很难想象如果“谷歌一下”变成一句空话是什么样的。但是,如果我们暂停一下,想一想只能依靠口述来进行互动交流的情形,就会发现在那个时代获得经验的难度大大增加了。当然有些人类可能会比常人更加勤奋地挖掘自己的记忆潜能,他们可能会拥有更好的记性,但在任何领域显然都无法用某个人的脑袋来装下所有的知识细节。即使是如今专业工作所依赖的知识体系的一小部分,也没有人可以完全记在脑子里。

  那时专业经验的数量、复杂程度、详尽程度都远不及现在。人类学家和历史学家都熟知,用如今的理念和眼光去评估过去的社会和那时的社会能力总是艰难的。尽管如此,坐在21世纪的靠椅里,我们可以假设在口述时代里,每个领域的经验都掌握在一小批社会的年长者手里,他们为自己赢得了神秘的地位,因为他们能够轻松利用过往经验以及先人流传下来的真知灼见。他们还会把这些知识教给接班人。在口述时代,正式的专业服务尚未出现,知识流传下来的记录不成体系,可以传播经验的技术还没出现,可供这些年长者共聚一堂的机构也不存在。

  把时间再往后推移一点,我们就来到了以手稿作为主流信息形式的时代,沃尔特·翁再次提出了警示:

  书写……很晚才出现在人类发展历史上。地球上的人类智慧已经存在了大约5万年,但第一份手稿,真正的书写作品,就我们所知,是美索不达米亚的苏美尔人在公元前3500年写下的……事实上,语言是如此压倒性地以口头表达形式存在,在人类历史上被使用过的大量语言——可能存在过上万种——只有106种有足够多的书面材料流传下来,大多数从来没有被写下来过。

  在早期社会里,随着手稿的出现,人类的记忆能力就借助于书写和图片形式的记录得到提高了。正如詹姆斯·格雷克(James Gleick)在他所写的《信息简史》(The Information)里所描述的,“这种人工的记忆能力是无法估量的”。这样一来,社群的知识和经验数量开始上升,并得到了有效管理。当人们能够使用手稿形式阐述和记录信息,知识和经验就能够以更精准的表述传达给整个社区。这里出现了一种新的复杂性,专家有时会选择用行话或者速记来记录自己的思考成果,这些语言对外行人来说就无法理解了。

  在手稿时代,尽管知识已经能够被获取、被修订,但是它们的传播范围仍然受限于手抄誊写的做法,在当时这是唯一可行的复制作品的方法。这样的方式既容易出错,又耗时费力,因此知识传播的难度不低,修改的频率也无法提高。外行人需要接触专家,进而了解他们所掌握的不断进化的知识、概念和行话。早期的守门人同时身兼顾问和问题解决者的角色,他们的确是专家,但并没有加入专业组织。然而这并不意味着没有明确的专业人士。名医希波克拉底、大律师西塞罗,以及犹太学者迈蒙尼德,这些专家在手稿时代已经非常活跃,但是他们并没有接受过当代专业人士那样的教育,他们也没有在现代专业机构所提供的保护伞下工作过。

  同业公会是某些特定交易的交会点,在这里可以找到专业工作和专业机构最早期的迹象。许多同业公会都随着印刷技术的兴起而繁盛起来。在15世纪中期,约翰内斯·古腾堡(Johannes Gutenberg)发明了印刷机以及一个铅字印刷系统,自此革新了人类教育以及信仰宗教的方式(《古腾堡版〈圣经〉》是西方第一本主要的印刷书籍)。印刷同时改变了社会中知识和经验生产、储存和分享的方式。得益于此,学者和研究员能够分享他们的发现和见解,新的想法能够以文件形式被捕捉到并储存起来,然后展开探讨,印刷的文献和书籍也能够简单流转起来。自此,记录在案的信息在数量和复杂程度上都发生了爆炸式的增长。

  直觉告诉我们,在印刷社会里,知识应当变得随手可得了。然而正相反,社会需要许多媒介来帮助人们了解、管理、应用被创造出来的大量材料。特别是在19世纪工业革命之后,借助专家的能力来处理经常动态变化着的大量信息和知识的需求变得尤其突出。其中一类专家,也就是如今我们熟知的专业工作团体,就此走向繁荣。

  4.3 技术互联网社会

  信息技术以及互联网结合在一起已经改变了人类创造、搜寻以及传播信息的习惯。印刷为我们带来了巨大的变化,但几个世纪以来,印刷本身却一直是一项有门槛的营生,需要重型设备以及操作技巧。如今我们只需要使用随处可见的文字处理软件以及激光打印机,就可以创造出高质量的文本,但这些设备在20世纪80年代非常罕见,直到90年代才被广泛应用起来。

  如今的大多数人,在公司或者在家,都能够使用一系列技术为他们打印高质量的印刷材料。一连串的技术创新,比如说大批量复印机、可转换格式的文字处理文件、互联网文件转换等,已经改变了我们生成、传播这些文件的方式。我们曾经把这些叫作“桌面出版系统”,但如今这些设备已经变得稀松平常,无须特地为它们贴上标签了。

  尽管创造与分享文件的能力得到了提升,然而对所有人来说,这并没有把知识和经验变得更加易于获取和简明易懂。互联网让人们可以轻松接触到大量内容这一点是毋庸置疑的,但是各种网站、社交网络、网络出版机构生成了比以前多得多的文件和网页,其中大多数,对非专业人士来说仍然是无法解读的。当普通用户在网上进行基本搜索时——关于医药、法律、建筑、会计或者其他主题——搜索结果往往是许多可能相关但技术性很强的文件和网页,而不是问题的答案或者提炼过的建议。比如一部在线百科全书,有教育意义也有提示性,但是一般无法针对用户所面临的挑战给出建议、提供忠告,或者指出下一步该怎么做。此外,用户很难分辨这些复杂领域相关的在线资源是否权威可靠。

  这一分析导致有些怀疑论者得出结论,他们认为网络和社交媒体对社会有着毁灭性的冲击,创造出堆积成山的信息,增加而非减少了社会对于专业人士的需求——需要他们根据特定场景可靠地解读并运用这些信息。然而这一推论是基于错误的假设,即假设我们已经完全从印刷工业社会进化到技术互联网社会(注意,此处的“技术”主要是指“信息技术”)。我们对此的回应,正如1996年那时所说的,我们仍然处于两个时代之间的漫长过渡期,所谓的“信息过载”是过渡阶段的诸多遗憾之一,但也只是暂时现象。我们同意在这一过渡期,身处传统机构的专业人士仍然是被社会所需要的,外行人士可能已经可以接触到大量知识,但他们无力自行解读。此时,专业人士的角色就像是“桥梁”。然而,当我们完全进化到技术互联网时代,材料的数量和复杂度都不会展现在用户面前,新的技术将对信息进行后台处理,因此就不再需要传统专业人士在普通人和他们所需要运用到特定场景和问题上的实践经验之间扮演翻译官的角色了。

  我们在1996年第一次提出这一论点的核心概念,当时将其称为“技术延迟性”:

  我们在使用计算机技术来捕捉、存储、调用以及再生数据方面的能力,远远超过了我们运用技术来帮助分析、优化、整理在数据处理过程中所生成的海量数据的能力。我们善于取得信息,却不懂得如何合理提炼我们所需要的信息。

  技术延迟性描述的是技术专家口中的“数据处理”和“知识处理”之间的延迟。在这样的前提下,我们认为在延迟性被消除前,在知识处理达到和数据处理的同等发展水平之前(把我们从信息管理的困境中解救出来),我们无法进步到一个成熟的技术互联网时代。

  换句话来说,我们认为复印、扫描、文字处理、电子邮件从20世纪90年代开始,造成了信息过载的问题,但我们至今没有发明出相应的技术。因此在各种专业技术领域,迅速膨胀的原始素材就像一根消防水龙带,装满了信息不停喷向外行人士。同时,相比20世纪90年代中期,我们如今对专家意见的需求似乎有过之而无不及。我们在提出技术延迟性的同时,也提出了一个预测:

  我们正在优化知识处理领域的技术,逐步开发系统,用于帮助我们分析和管理由我们自己创造出来的大量信息。这些系统将帮助我们精确找到所有且仅限于和用户特定需求相关的材料。

  这一预测当时遭到了许多质疑。然而,我们只需要想想现在谷歌的搜索能力、数据科学各项倡议的成功(例如大数据领域),以及像Waston这样的人工智能系统新浪潮,就能意识到技术的延时性问题正在稳步得到解决。我们那时的预测是“未来25年里,知识处理方面的进步将会十分惊人,并且把我们从过渡期里解救出来”,然后进入所谓的“技术互联网时代”,我们认为,这一预测将会更快得到证实。在专业工作领域,一旦这些技术成型,原始素材的数量、复杂度以及变化性对外行人士的挑战都将变小,因为系统将为他们更加精确地找到他们所需要的相关材料。除此以外,我们日渐强大的系统将开始解决问题并提供建议,不再仅限于取用及展示可能相关的文件。更激进的研究者认为,未来的系统甚至可以预测到人类的需求,甚至在人类意识到问题或机会之前,就相应地提供指导和预警。

  就像我们对人类专家寻求指导的要求随着时间发生变化那样,社会的信息结构也从口述时代进化到手稿、印刷时代,因此我们必须明白,当我们进入到一个拥有比从前强大许多的处理能力和沟通技术的世界中,信息结构还会进一步发生变化。专业工作都是以知识为基础的,因此如果我们存储、交互知识的主要方式发生巨变的话,专业工作中所用到的知识的存储和交互方式也会相应发生改变。这不仅是因为现在的专业机构没有好好开发利用新技术,导致它们无法提高效率,而且更因为信息基础所发生的变化其实是更加根本性的。它决定了我们如何组织、如何向社会提供这些由集体创造的知识和经验。

  从印刷工业时代进入到技术互联网时代,我们预计人们分享经验的方式将要发生翻天覆地的变化,而且变化的程度将远远超过从手稿时代进入印刷时代那个阶段。

  这次变革并没有等着政客或者专业人士来发起。我们已经看到社交网络在推翻政治制度活动中表现出来的强大力量了。我们不应当假设通过网络连接起来的30亿人类,一旦发现改善生活质量和提高生存标准的全套工具就在手边,居然会缺乏动力去改变经验分享的方式。当人们发现例如改善健康、促进教育、增强法律保护这样的事宜都可以通过线上方式来实现,那么无论政策制定者和专业工作人士是否积极支持,这些方式都会受到人们的欢迎。

  4.4 对未来的影响

  这本书许多地方都表达出了对即将出现的更新、更好的技术的期待。人们通常认为探讨技术的长期趋势十分困难,因为所有重大的进步都是难以预测的,但我们坚信这种未来势不可挡。管理学大师彼得·德鲁克(Peter Drucker)以及无数人都说过,“对于未来,我们唯一知道的事情,就是未来会变得不一样”。但是,我们强烈反对这种看法——并非不同意“未来会变得不一样”,而是不同意这是“我们唯一知道的事情”。

  我们的确看到,为了支持未来不可预测的观点,拥护者能举出很多很好的例子:IBM在1981年把个人电脑推向市场,但20世纪70年代时并没有人预见到这一天;诞生于20世纪90年代的网络也是一次完全突然的“袭击”;类似的,专家们也没有预见到社交媒体的出现,尽管现在它们已经十分风靡了。因为我们没有(有些人认为是无法)预测到这些重要的发展,因此类似的,大家就认为去想象五到十年后的世界是没有意义的。我们将会证明这样的观点是错误的。因为这样我们就会错过重大的飞跃。相反,我们相信有三种值得去尝试的方式可以帮助我们预测技术的未来。

  第一,即使未来十年中不再出现像个人电脑、网络、社交媒体这样根本性的技术进步,但只要对现有和新兴技术的潜能进行深度挖掘,同样能够把我们引领到一个非常不同的世界。不能因为我们无法预见任何革命性的变化,就彻底放弃在已有的技术基础上进行推测。比起完全忽略未来,如果参考现有的框架,考虑正在逐步普及的技术,那会让我们找到更好的方向感。虽然我们还是有可能错过下一次变革,但至少可以跟上现有技术的发展步伐。

  第二,我们认为找出技术的大方向和大趋势十分重要。我们可能无法精确指出下一代技术应用具体会是什么,但如果我们对人类行为和新系统的各种可能的模式和趋势进行思考,就能够为探讨未来提供有价值的背景信息。未来最不可能发生的就是各种系统仍然保持着今天的模样,然而那些放弃尝试预测未来的人,常常会掉入陷阱,认为未来会一成不变。不愿意尝试探索整体局势,就像开夜车却不愿打开车灯,而对未来进行高质量的预测就像是打开了车灯。当然我们承认,还是有许多我们看不到的东西。甚至我们也同意,在未来20年里将要改变我们生活的许多互联网系统也许都还没有被创造出来。

  就这本书而言,还有第三种值得预测的内容,那就是有潜力广泛运用到专业工作中去的那些特定技术。在对这些系统做预测时,我们并不去推测那些高深的理论,比如说“可计算性”或者“后硅时代处理器”等,我们仅仅关注在特定专业领域取得成功的系统,并且认为它们可能有着更广阔的应用前景。

  信息技术的指数级发展

  日益功能强大的机器

  越来越普及的设备

  愈发紧密连接的人类

  针对我们提到的前两类预测,我们发现并探讨了四种主要的、在某些层面有一定重叠的信息技术四大主要发展。在我们看来,这些是信息技术和互联网系统带来的最重要的发展。这一系列变化结合起来,将改变专业工作的运行方式,以及社会分享实践经验的方式。

  4.5 信息技术的指数级发展

  身为平板电脑、社交网络、视频会议、在线游戏、流媒体电视以及其他无数系统的用户,我们很少有人会去思考技术层面也就是机器内部所发生的事情。显然,用0和1的体系去思考这些日常用品是非常困难的。但大多数人,对技术问题还是有些模糊概念的——一旦系统变慢,我们无须指导也能做些大胆猜测,比如,我们需要更快的处理器、更多内存、更大的带宽。好消息是全世界的实验室都在投入大量精力去解决这些问题,而且进展十分惊人。我们想先向大家传达一个消息,和许多其他观察者一样,我们都发现了人类在信息技术方面所取得的进展已经让运算能力获得了“指数型增长”,再具体一点,就是大家所知道的摩尔定律。1965年,在戈登·摩尔(Gordon Moore)联合创办英特尔三年之前,他预测说大约每18个月,芯片(集成电路)上的晶体管数量就会增加一倍。更简单的说法是,他预测计算机的处理能力每18个月会翻一倍左右。怀疑论者当时曾经说过,摩尔定律可能只在几年内成立,但如今它仍然适用。事实上,有些人认为如今的计算机运算能力甚至每18个月就可以翻一番。材料科学家、计算机科学家和行业分析师甚至认为摩尔定律在未来几十年内,还能保持成立。严格来说,每个芯片上能容纳的晶体管数量在物理上是有极限的,即使如今实现运算能力翻倍所采用的技术已经不再是摩尔当时所想的硅基合成电路,但人们仍然根据摩尔定律,粗略地预测运算能力每18个月可以翻番。让我们来做一次思维实验,来体会指数增长有多强大。先想象你面前有一张轻盈的纸片,然后开始不断对折这张纸。经过四次对折之后,它会变成信用卡那么厚。这并没有什么特别的。如果这张纸能够被折叠11次,它会变得像一罐健怡可乐那么高。这还是没什么。如果对折21次,它的高度就可以超过大本钟(Big Ben);对折31次,它就进入外太空了;对折43次,它就可以碰到月球了……如果你能够把这一张纸片对折100次,它的高度将超过930亿光年。如果真的可以如此加速发展,延展到这种规模,那将十分难以想象,但运算能力的确正在不断翻倍。当数学家把这称为“指数级增长”,专业人士可能仅仅认为这是爆炸式的增长。

  运算能力的增长已经带来了深远的影响。诺贝尔经济学奖得主迈克尔·斯宾塞(Michael Spence)发现摩尔定律在“计算机时代”(在他眼里,开始于1950年)的前50年里,为人类把运算成本缩减了“大约100亿倍”。雷·库兹韦尔(Ray Kurzweil)在他写的《奇点临近:2045年,当计算机智能超越人类》(The Singularity is Near When Humans Transcend Biology)里强调这一切仍将继续。库兹韦尔认为,“信息技术的基本度量遵循着可预测的指数型的发展轨道”。为了解释“指数级发展”,他说:

  人类所创造的技术的变化节奏正在加快,这些技术的影响力也在指数级增长。“指数级增长”是具有欺骗性的。开始时几乎无法察觉,又在突然间疯狂爆发——也就是说,如果不去追踪它的轨迹,根本无法形成预判。

  让我们来看看这对日常生活意味着什么。想一想库兹韦尔所说的,到2020年,一台普通的桌面机器(售价1000美金左右)将拥有与一个人类大脑大致相当的运算能力。更加令人难以置信的是,他认为到2050年,遵循“指数级增长”的路径,“1000美金的计算机所拥有的运算能力将超过地球上全部人类的脑力之和”。读者可能会认为我们激进,但是如果我们能够预见到那么一天,一台普通计算机的运算能力就能超越所有人类之和,那么专业人士的确应该重新审视一下他们目前的工作方式了。

  我们还应当注意这种“指数级增长”并不仅限于运算能力。其他技术——包括硬盘容量、互联网带宽、磁性数据存储器、随机存取存储器——也在以类似的速度发展着。存储卡就是一个很好的实例。2014年,128GB的存储卡已经司空见惯,但10年前的2005年,相对应的存储卡是128MB。这意味着存储容量在10年里增长了1000倍(还稍微多一点)。这换算过来就是每年翻倍,比运算能力的“指数级增长”曲线更加陡峭。梅特卡夫法则的理念也是异曲同工,这个法则认为(总的来说)一个网络对于用户的价值和连接在这个网络里的用户数量的平方成正比。有时这被称作是“网络效应”,意思是随着用户数量的增加,网络的效用呈非线性增长。另外一个例子是库梅定律——每隔18个月计算耗电效率会提高一倍,过去60年以来这一定律一直成立。我们知道并不是所有人都同意库兹韦尔的理论,但是,其他专家和评论员在运算能力“指数级增长”这件事上有着类似的结论。不可否认,并不是信息技术的每次指数级增长都能为系统更新迭代的速度和规模带来飞跃式发展,但一旦持有“指数级增长”观点人士的预测和推论有那么一点接近事实,我们就将迎来一段空前的技术进步时期。我们在这里想传达给专业人士的信息是,尽管我们已经在许多系统中看到了各种非凡的进步,但其实我们刚刚开始“爬坡”,仍然身处于信息技术加速发展的起步阶段。在大多数读者的有生之年里,我们的生活和事业都会被强大的运算能力彻底改变——“云”提供着似乎取之不尽、用之不竭的存储空间,闪电般迅速的沟通交流、史无前例的微型化、组件成本的迅速下降都在发挥着各自的作用。这并不是明年要上市的新iPhone,而是正在发生巨大变革的专业人士和服务对象手中的工具。

  在这一章剩下的讨论中,我们会看到这样的“指数级增长”直接的体现是把系统变得更强大,把设备变得更普及,也让人与人之间产生了更多的联系。

  4.6 日益功能强大的系统

  现在让我们来聊聊技术对于专业工作来说的最重要的特征。可以用一句话来归纳:我们的系统和机器正在变得越来越强大。如果读者读完这本书,关于技术只能记住一个知识点,那么,请记住上面的这句话。当我们想到未来机器的能力时,大体的技术进步发展轨迹是清晰的,而且对专业工作来说有着重要的意义——越来越多曾经需要人类执行的工作,在许多不同系统的帮助下,变得更高效、便宜、简单、迅速以及高质量。而且我们并没有看到终点,新的能力每天都在涌现。

  有些专业人士对技术变化的速度和维度提出质疑。他们常常会抱有“技术短视”的偏见。他们倾向于基于目前的技术状况去评估它们可能带来的影响,这样可能会做出过低的评价。当我们谈到由机器代替人类执行任务时,怀疑论专业人士会表示质疑,因为目前的系统并不能完成相关任务。这是目光短浅的行为。此前,我们讨论过一系列跨专业领域的技术创新,最令人吃惊的地方在于,五年前这些系统根本不可能被创造出来。因为当时我们没有必要的技术基础——移动平台、网络带宽、软件或者其他。

  此处有一个重要的信号,机器已经不再被局限于那些重复性的机械工作了——比如办公室里的基础行政工作,或现代工厂里的饼干切割工作。许多系统都提醒我们去重新审视一种流行观点:由机器和系统来执行日常工作,由人类来专注处理那些需要灵巧度和智慧的活动。但是,当机器变得越来越能干时,这一边界正在逐渐模糊。有许多方式可以来勾勒这些新出现的、日益强大的机器和系统所拥有的特性。有些人使用“智慧机器”,有些人则习惯用“超级智能”,还有人喜欢用“人工智能”或者更加常见的AI。我们自己也更倾向于使用AI,但是我们认为这些新崛起的系统是AI的第二波浪潮。尽管我们在谈论新系统,但事实上我们并不知晓,也无法了解哪些系统最终将带来最巨大的变化。正如我们之前说过的,我们可以很自信地做出预测,未来20年里能够改变人类生活的有些技术其实还没被发明出来。

  为了便于大家理解目前的进步,我们现在一起来研究四种发展趋势,它们可以证明机器正在变得越来越能干。

  第一种,机器现在可以深入研究我们的过往经验和识别模式,发现其中的规律,做出精准的预测(大数据)。

  第二种,有些系统已经可以处理那些通常被认为需要人类智慧才能操作的任务(IBM的Watson)。

  第三种,有些机器可以在物理世界里完成讲究技巧的、精细的手工操作(机器人)。

  第四种,有些系统已经可以辨识并且表达情绪(情感计算)。

  大量围绕这四个主题的著作已经问世了。我们只是尝试着做个概述,而不是进行学术评估。顺便一提,我们并不认为只有这四个是重要的发展。我们还可以加上“语义网”“搜索算法”或“智能代理”。但是争论哪些技术更重要就偏离主题了——利用各种技术,我们的机器将会变得越来越完善,能够完成越来越多的、曾经被认为是人类专属领域的任务。

  大数据

  1988年,作为如今“大数据”概念的先驱,哈佛大学的肖沙娜·朱伯夫(Soshana Zuboff)在她那本开创性的著作《智能机器时代》(In the Age of the Smart Machine)中写道:“信息技术不仅执行着具体的任务,还带来了一种可能性,创造出一种新方式,使各种活动、对象和流程都变得可见、可知、可分享。”简单说来,她所指的是计算机时代的副产品——大量信息流的价值。比如,早期的存货管理系统所产生的信息可以帮助了解用户购买习惯。朱伯夫把这称为“智能技术提供信息(informating)的能力”。尽管“提供信息”这个词汇并没有广为流传,但现在人们都认为她的主要观点都是正确的,即分析由技术产生的大量数据可以让我们形成有价值的新观点,可以帮助我们在许多领域进行更加可靠的预测。专注于捕捉分析信息的工作如今被通俗地称为“大数据”。这个术语一开始出现时,主要特指对于大量数据进行处理——例如,大型强子对撞机所产生的海量数据。而如今,“大数据”也被用于指代使用相关技术来分析比前者要少得多的信息。有些人也使用“数据分析”“数据科学”或者“预测分析”等词来描述这一分析过程,但所有这些词似乎都代表着同样的内容。无论哪种标签更受欢迎,这方面的专家常常被叫作“数据科学家”。

  一直以来大数据是绝对不缺少关注的。有些评论家认为,大数据的能力被夸大了,它的方法也还需要继续发展,这些观点不无道理。但我们无法对目前世界上正处于爆发中的数据量置若罔闻。2010年,谷歌当时的首席执行官埃里克·施密特(Eric Schmidt)曾说过,现在每两天里被创造出来的数据量等同于从人类进入文明社会到2003年之间的总量。按照现在看得到的数据,到2020年,只需要几小时就能生成同样体量的信息。这一飞跃,部分归功于大量涌入网络的视频、图像、音像资料,还有一部分原因在于迅速发展起来的各种平价传感器。关于后者,有一种观点认为到2020年,世界上通过这种传感器产生的数据比重将从2005年的11%上升到42%。这一切导致了海量的数据散落在各处,广大数据科学家的目标就是发明出收集、分析、利用这些数据的方法。大数据领域的成功案例分析很多。其中之一(并非毫无争议)是谷歌 Flu Trends,这个系统可以通过分析关于相似病症的搜索请求归纳其用户所处地区,能够比从前更早地识别出流感的爆发。另一个案例来自于沃尔玛,他们针对每次飓风前顾客的购买行为进行分析,发现手电筒的需求会大幅上升,水果馅饼的需求也同样上升;基于这一发现,他们在下一场暴风雨之前就会增加这些商品的库存。据说自然语言翻译系统和无人驾驶汽车也都是在大数据技术的基础上建立起来的。我们知道有许多方式可以让大数据创造价值,但这方面大多数专家都同意维克托·迈尔-舍恩伯格(Viktor Mayer-SchI nberger)以及肯尼斯·库克耶(Kenneth Cukier)的观点:“大数据的核心是预测,把数学应用在大量数据上,以此来进行概率推算。这些系统之所以能够运转良好,是因为它们获取了大量的数据作为预测的基础。”计算机科学家埃里克·西格尔(Eric Siegel)说得更夸张,他认为,“通过疯狂吸收现代社会最强大、最有效的非自然资源——数据,计算机可以自动开发各种新的知识和能力。”如果把这些大数据的观点整合在一起,我们会发现它们在专业工作方面的潜力——成为进行预测、产生新知识的工具。然后,我们必须识别出适用的数据源。我们想到了专业人士在工作过程中所创造出来的数据。这包括他们收集的信息以及他们所提供的指导——医疗记录、法律文件、财务记录、税务申报单、建筑图纸、咨询报告等。在互联网普及以前,甚至互联网时代早期,大多数专业人士对收集、分析数据没有太大兴趣。恰恰相反,大多数专业人士的关注点是他们手头的特定工作,而所产生的数据(即“数据尾气”)倒像是项目结束之后立即可以丢弃的东西。某种程度上,这些数据大多由学术界去收集、研究,这些数据是传统专业工作方式下的副产品。大数据领域的工作成果,可能会为我们揭示出以前没有被专业人士辨识出来的各种规律、相互关系以及观点。这可能会形成某种新的实践经验,也可能为预测提供有价值的线索。这和专业人士随口一说“以前我们也见过这种情况,这有可能……”是不一样的。对大数据加以应用,应当能够发现新趋势、挖掘新知识,而从前专业人士对此并未留意或并不知道。这样一来,数据就成了“可供学习的无价经验大集合”。在医学领域,已经有大量数据集将症状和诊断联系起来做分析;在法律事务中将事实规律和司法判决联系起来;在教学中将学生表现和教学方法联系起来。当技术变得越来越精细复杂,这些数据能够提供从业人士无法提供的医学诊断、法律预测、教育见解。

  通过大数据技术产生的新知识属于我们所说的“实践经验”的范畴,不仅包括专业人士自己所创造和应用的那些知识,还应当包括系统和机器所创造出来的知识。判断某一知识是否属于实践经验,并不应该依据它的来源——不管是人类大脑还是数据、软件——而应该看它是否能被用来解决一些特定问题。我们预期以大数据技术为基础的系统将能够以人类相当的水准,甚至高于人类的水准进行推论、给出建议、提供指导。

  在此需要强调的是,这些高性能的系统并不会去模仿或者复制人类的工作模式。某个系统将病人的症状和数据库内的千万病例进行对比诊断,这种做法和一个普通人类医生进行鉴别诊断完全不同。系统可能会将某个案件的情况同数以万计的过往案例进行比对,以此来预测法院的裁决,但普通人类律师则不是这样工作的。大数据技术并没有,也不会把专业人士的工作方式变得更加自动化。相反,通过收集和利用大量过往经验,这种技术把以前不可能采取的方法变为现实。用人工智能领域数十年来的领军人——帕特里克·温斯顿(Patrick Winston)的话来说,“有许多可以实现智慧的途径,它们和人类的方式并不一定相同”。

  IBM Watson

  我们把IBM的Waston系统看作人工智能方面的里程碑,它不是按照人类解决问题的思路来设计的。某种程度上,开发Watson是为了证明机器的确可以拥有高度智能。这个系统以IBM的创始人托马斯·约翰.沃森(Thomas J.Watson Sr.)来命名,开发目标是为了参加美国的一个电视竞赛节目——Jeopardy。这代表了IBM在20世纪80年代被称为“博弈”的AI分支方面做出的最新贡献。之前,IBM还开发过深蓝(Deep Blue),这个计算机曾经在1997年击败过国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)。在20世纪80年代早期,这种系统似乎是不可实现的。大多数国际象棋系统方面的研究人员都清楚认识到,世界上最杰出的棋手似乎都会有创造性的、直觉性的、战略性的跳跃等奇招,连棋手本身都很难说清这些招数的道理,更别说那些试图开发系统的人了。当然最终,在计算能力指数级增长的助力下,通过蛮力计算,这个系统战胜了最厉害的人类棋手,主要秘诀在于计算机会提前预测许多步——和人类的思维模式并不一样。认为这些会下国际象棋的机器所采用的招数和人类思路不同那还情有可原,但如果因此而大肆贬低这些系统的能力就犯下了我们所提过的AI谬误了——这种错误的观点认为开发出专家级甚至更高水准的系统的唯一方法就是复制人类专家的思考过程。这种错误也常常出现在针对Waston的各种评论里。

  当然Waston的开发工作是另一种挑战。为了在Jeopardy节目现场能有出色表现,参赛选手必须拥有范围广阔而且具备深度的知识储备,而这正是20世纪80年代时AI批评家对计算机能力提出的质疑。如今这场对弈已经广为人知,2011年1月14日,在一场Jeopardy的电视直播里,Waston击败了两位有史以来最厉害的人类参赛选手,这的确算得上是一项杰出的成就。这个计算机系统,有条不紊地应答着世界上的任何问题,并且比最擅长此事的人类更加精准迅速。无论怎么歌颂这一成就都不过分。对我们来说,它代表着AI第二波浪潮的到来。参加Jeopardy的Watson版本存储了超过2亿页的文件,内置了大量AI工具和技术,包括自然语言处理、机器学习、语音合成、博弈、信息检索、智能检索、知识处理和推理以及许多其他工具。我们再强调一次,这种AI,和20世纪80年代的专家系统那一批AI是完全不同的。回归到信息技术“指数级增长”的话题,有趣且值得一提的是,在2011年,Waston所使用的硬件据说占了一个卧室那么大的面积,而目前它的硬件尺寸相当于三个比萨盒子。到2020年,Waston的硬件可能就只有一个智能手机那么大了。

  我们希望读者花点时间去想一想,如果把Waston这一类的技术应用到各种专业技术领域,将能带来哪些跳跃性的影响。IBM已经在准备进行这一跳跃了。在他们的网站上,他们特别说明,“Waston已经开始学习专业人士的语言,接受专家培训来学习从事各种行业的工作”。IBM还谈到“Watson生态系统”,即一个正在开发各种基于Waston的应用程序的社区或组织。律师、医生、银行家、保险公司、教育工作者都已经参与到其中。除了巨大的商业价值以外,2014年早期,IBM还计划在10年里投资1亿美金用Watson来帮助发展非洲的医疗和教育事业。值得注意的是,医疗保健领域是IBM计划应用Waston的主要领域之一,已经出现了各种基于Waston的系统,可以进行诊断、准备治疗计划、进行高标准的研究。尽管IBM和负责该项目的医疗专家对此保持谨慎态度,但目前,在一些任务上Waston已经比人类表现更出色了。

  我们预计用不了多久,更多任务将由Waston来执行。目前已经有许多技术可以去支持其他专业工作开发强大的系统。这样一天终会到来——用户可以通过互联网,用自然语言向计算机请教大多数专业问题,并且能够得到合理的答复、有价值的建议、语句优美的支持性文档,而这一切都和人类专家所能提供的服务标准看齐。

  机器人

  1495年,在意大利,达·芬奇设计且极可能建造了——西方世界的第一个人形机器人。机器人这个单词,来自于捷克语中的robota,意思是苦差事或者奴役。更近的起源来自于捷克作家卡雷尔·恰佩克(Karelapek)的剧本,他于1921年首次将这个单词用于他的剧本《罗莎姆万能机器人》(Rossum's Universal Robots)中。从那时起,人类对各种“人造人类”(包括半机械人、人形机器人、类人)产生了巨大的兴趣,它们在各种西方文学作品和戏剧中占据了重要的地位。总体来说,机器人这个词汇现在被用来形容某些由软件驱动的机电系统。有时候,也并不总是这样,这些机器人是自治的,也就是它们可以不受人类干预,独立完成自身的工作。但是直到目前为止,这些机器对我们日常生活的直接影响还是有限的。比如说20世纪80年代之际,在学术研究领域,机器人是众多AI课题中比较低调的分支,那时商业世界里占据主流的是工业机器人——它们体积庞大且功能单一,从事焊接、锻接、螺栓连接、喷漆或组装等工作。典型的应用场景是汽车制造业的工厂中。过去十年中,机器人领域所取得的进步是巨大的,美国经济学家弗兰克·利维(Frank Levy)和理查德·默南(Richard Murnane)也一定会表示同意这一点。他们在2004年写下了一本重要的著作《新劳动分工》(The New Division of Labour),在书里他们提出了问题:有哪些工作计算机可以完成得比人类更好(以及反过来有哪些工作人类可以完成得比计算机更好?)?有哪些工作将得以幸存下去?他们认为计算机导致“人类工作性质产生了巨变”,并且它们会不断地在“越来越宽泛的领域里取代人类,而且这个清单每年都在增长”,但他们并没有预测计算机将要取代所有的工作。当时他们认为驾驶是超出计算机能力范畴的任务之一。他们说“难以想象”卡车司机有朝一日会被计算机取代。短短十年后,谷歌就已经开发出一支自动驾驶车队。十年内,机器人已经从“车辆制造者变成了驾驶员”,是不是特别意义非凡?到2014年底,谷歌无人驾驶车的行驶里程已经接近113万千米,期间只出了一次事故(据说肇事方是一辆人类驾驶的车辆)。在美国已经有四个州以及华盛顿特区通过立法,允许无人驾驶车辆上路。到2020年,大多数车辆制造商都准备生产和销售无人驾驶车辆了。我们猜测,在某个时候,人们回顾过去时会吃惊地发现“太让人惊讶了,从前人类居然需要自己开车”。

  其他各种高级机器人也层出不穷。每年,制造业要安装20万个新机器人(在2015年150万个存量机器人的基础上)。值得一提的是美国的亚马逊公司,2014年他们在10个仓库里使用了15000多个机器人。这支机器人部队负责取下货架上的商品,把它们交给人类雇员。让机器人来从事这些工作更安全可靠也更经济高效。然而,专业人士可能还是很难正视机器人对他们的工作产生直接影响的现实。

  我们认为,机器人和专业人士工作有三方面的相关性。第一个方面,对于那些需要手工技巧和精细操作的专业服务(像外科手术、牙医、兽医以及建筑),机器人的参与度将不断提升,甚至取代如今人类的活动。医疗和外科手术领域已经显露出这股潜力——从在医院里负责分配药物、分发纱布的机器人到帮助纽约的外科医生为法国的病人执行远程手术的Zeus手术机器人。仿生假肢技术(Prosthetics)也属于这一范畴。MIT媒体实验室的研究员大卫·罗斯(David Rose)认为,“仿生假肢技术拓展了我们的身体机能,提升了我们的感官能力,以及手脚的灵活度……帮助我们内化了计算机的能力。它变成了我们的一部分,以至于它就是我们”。假以时日,机器元件会变得像我们身体的自然延伸。

  第二个方面,与机器人技术和专业人士工作直接相关的细分领域——“机器人感知”有关。这使机器人拥有了诸如检测人类的生理状态及变化的能力。就像我们后面在“情感计算”章节里会讨论的,这将让机器有能力辨别、回应用户的情绪状态。除此以外,机器人感知使得机器能够听得见(信号处理)、看得到(图片处理)、摸得着(压力和图案处理),并且能够识别方位、速度、温度、气压、光线、风力、湿度以及声音。简单说起来就是,机器可以和物理世界进行互动了。

  第三个方面可以被称为“陪伴者”。这类系统的代表之一——Paro的商业版本早在2004年就已经面世了。Paro是一种海豹宝宝外形的治疗型机器人,它可爱的外观设计是为了安抚病人的情绪。我们明白并不是所有人都需要一个机器海豹,但是过去十年间,这类系统已经被开发出来,并且从医疗角度做了改进,它们可以为病人提供持续性的陪伴。其核心想法之一是希望借助机器人来照顾老年人。有很多不同的系统,其中有些可以帮助举起重物,有些可以从地板上捡起掉落的东西,有些可以帮助老人洗碗,有些则负责提供陪伴甚至能够表达同理心。如果配合使用之前提到过的感知设备,比如说织进病人衣服里的传感器,这些机器人陪伴者可以和它们的帮助对象进行互动。这里还有一点更加有共性——机器人可能会变成传播实践经验的标准界面或工具。人们不再坐在屏幕前思考应当在谷歌里输入什么搜索条件,而会有一种新常态——和某种机器人陪伴者聊天,向它提问。有些人会把这种类型的机器人当作“可靠的参谋”。

  最近与这三种机器人相关的技术基础都有了非常重大的进步。机器人已经大跨步地从工业制造领域进军到精细应用领域了——这些机器变得更小型、更便宜、更灵活、自动化、可移动、多用途,同时也变得更灵巧、更有感知力、能提供更好的陪伴,但这些都只是热身活动。机器人的全球市场规模预计将从2010年的150亿美元增长到2025年的670亿美元。实际上,机器人让人多少有些惶恐,许多人对于机器能够成为富有同理心的陪伴者,甚至可以适应周围环境这样的想法感到不安。我们在此触碰到了日本的机器人专家森政弘(Masahiro Mori)在1970年提出的“恐怖谷”概念。这个概念说的是,机器人越像人类,我们对机器人的情感回应就越积极。但是这种正面回馈只会持续到某一特定程度——因为当机器人的特征和行为变得与人类十分类似时,我们通常会体验到厌恶的情绪。这一分析中有弗洛伊德的影响,但同时也犯下了AI谬误。我们应该保持开放的心态去拥抱新方式,当自己接受来自外部的同理心时,好好去体会这份宽慰。这并不困难——很明显,我们已经对机器形成了情感依赖。根据大卫·罗斯的观察“设计师们在创造机器人时所使用的小花招之一……就是利用人类心理上的幼态持续——可爱”。我们对水汪汪的大眼睛和银铃般的笑声毫无抵抗力。这把我们引领到另一个相关领域——机器似乎能够表达情绪。

  情感计算

  1997年,罗莎琳德·皮卡德(Rosalind W. Picard)在她那本开创性的著作《情感计算》(Affective Computing)里解释说,她正在“呼唤计算机领域的变革,她认为我们遗漏了计算机智能方程式里的一个重要变量……计算机能够认知并表达情感”。她的意思是,在我们的系统和机器能够处理情绪之前,它们将很难以人类同等智力水平去参与活动、执行任务。

  几乎20年过去了,如今情绪机器的概念开始流行起来。在《纽约客》杂志上,拉斐·卡查杜里恩(Raffi Khatchadourian)写过“计算机如今能够超越人类,它们能更好地分辨出礼节性微笑和自发快乐时的真心微笑,它们还能够更精确地辨认出伪装和真实的疼痛”,语音专家已经开发出软件,“它能够通过扫描一位女性和一个小孩之间的对话,来识别这位女性是否是一位母亲”。他还提到了智能手机“经过改造,可以被用来探测压力、孤单、抑郁等情绪,甚至成为情感感知机器”。尽管所有这些都可能使人联想起伍迪·艾伦(Woody Allen)——他说过“我这辈子和机械产品从来不合拍”——然而情感计算已经站稳脚跟,成为了一门学科。它是计算机和心理学之间的桥梁,它的研究方向是调查、研究、设计、开发、评估相关的系统,希望这些系统能够辨认、翻译、回应、生成人类的情绪。这个领域并不广为人知,许多技术专家也忽略了它。尽管如此,最近出版的《牛津情感计算手册》(Oxford Handbook of Affective Computing)的篇幅已经超过了500页。就像我们在之前所说的,这个学科正在“迅速成长”中。情感计算所关注的核心是能够识别和表达情感的系统。因此,它并不是一个孤立的“帝国”。它和机器人的某些分支有重合之处。识别人类情绪的传感器通常都安装在机器人设备上,而表达情绪的系统本身往往就是某种机器人。许多专业人士都说解读以及回应病人、客户、学生的能力对他们的日常工作很关键。但是一个计算机系统究竟要怎么来识别人类的种种情绪呢?在实际操作中,基本上都是通过各种传感器去鉴定评估各种生理指标和变化,来实现自动辨识人类的情绪状态。比如,通过脸部表情来传达的情绪,可以通过计算机进行脸部分析;身体的移动可以通过陀螺仪传感器来测量;身体姿势可以通过压力传感座椅来识别;皮肤有导电性——电极可以捕捉到汗液中的各种元素或者电阻的变化;情绪状态也可以通过人类的眨眼模式、头部倾斜角度和速度、点头、心跳、肌肉紧张程度、呼吸频率以及脑电波活动得知。这样一来衍生出无数细分专业,比如声音学(分析声音的技术)、眼神学(研究眼球运动)、基于语法的情绪识别,以及可能最有争议的——幽默感识别等。所有这些创新对专业人士都有着重大的影响,比如,想象一下某个系统能够在一群学生中识别出厌烦、困惑或挫败的情绪。另一方面,用于表达情绪的系统以一套工具包作为基础。开发者面临的挑战之一是制作“话语生成系统”,也称为“语音合成器”或者“人工语音机”,这些系统需要使用声音来表达众多情绪。这项技术的挑战在于设计出能够模仿、表达同情并且和互动对象进行和谐沟通的机器。为身体和脸部表情进行计算机建模是得到采用的技术手段之一。更加具有野心的技术开发方向是“赋予形体的会话代理”(Embodied Conversational Agents, ECA)。这些都是人类用户的聊天伙伴,具有类似于人类的沟通能力。有些是可以活动的虚拟人类或机器人,可以通过对话以及会话以外的行为和人类进行社交互动,并且会使用适当的声音、声调、面部表情、姿势变化以及手势。把文化价值和社会规范搭建到这些拟人化的代理和机器人里去的工作正在不断进行中,这样一来,它们的情绪反应就能把与文化相关的变量考虑进去了。

  这些系统为了识别和表达情绪,需要调用情绪数据库里的海量数据。为了实现这一目标,情感计算已经开始和大数据联手合作了。这意味着情感计算的大型数据库正在构建中,部分数据来自于已有的数据集,部分正在通过众包方式进行采集。数据本身可以以各种形态存在着,有些是纯文本,还有许多视听格式的数据。但最重要的是,这些数据并不针对某个社会群体,它们希望做到跨文化和跨语言。简而言之,大量的数据被收集存储起来,投入使用的数据越多,就意味着机器可以更好地去识别和生成人类的情绪。

  针对情感计算的工作并没有到达顶峰。所有在这巨大的、不断延展的技术世界里探索的人们,都渴望系统能够变得更加人性化、易于使用。相应的,与识别、响应、生成人类情绪相关系统的投资也在不断增加。与大数据、AI、机器人的影响相类似,情感计算让我们对于机器将变得越来越能干这一前景充满了信心。

  4.7 日益普及的设备

  不久之前,计算机的运算能力很大程度上取决于它所占据的空间。只有那些被安放在恒温房间里的大型机器才能完成高强度运算。供应商和高级用户提到大型主机时都带着敬畏,这是一种只有少数有实力的机构才能负担得起的大型机器。但如今,这些大型主机的运算和存储能力已经被手持设备轻松超越了。

  20世纪七八十年代,摩尔定律一再得到证明,大型主机被微型计算机所取代,随后再被家用个人电脑所取代。进入80年代中期,第一批可携带的计算机以笔记本电脑的形式出现,虽然比如今常见的现代版本要厚重许多。那时我们用“便携式”这个词来形容它们,但它们看上去像工具箱,分量也像。后来出现了更轻的笔记本电脑(我的第一台笔记本电脑硬盘只有10MB;如今我们一台电脑的重量大概只有原来那台的三分之一,但容量达到了1TB——30年里增长了100,000倍)。

  如今比笔记本电脑更加常见的是手持设备,它们主要以手机和上网设备的形式出现。全世界现在有超过60亿的移动电话用户。在这些用户里,大约有20亿人使用的是可以连接互联网的智能手机,这一数字到2020年时预计将超过40亿。换句话说,世界上使用移动电话的人数将要超过使用牙刷的人(说明“普遍运算”的同时,也说明了牙齿卫生的现状)。同时,作为介于笔记本电脑和智能手机之间的产品,平板电脑正在变得越来越流行(尽管小型平板电脑和大屏幕手机的界限已经非常模糊)。总会有些人没有上网的条件,但是当计算机的可携带性和价格变得越来越亲民,这样的人群会逐渐消失。比如说,在英国和美国,绝大多数人都已经有上网的条件了。仅仅手持设备这一项所引发的变化已经随处可见,但当我们谈起“日益普及的设备”,我们还同时包含了“物联网”现象。无论是称之为“普适计算”或是“普遍运算”,这里的想法就是把处理器、传感器、互联网接入等,预装到实体对象里,就像是把可联网的微小电脑植入到日常用品里去:想象有一个可以查询火车时间的闹钟,万一火车发生晚点,它能够让主人多睡一会儿;一把能够联网查询天气预报的雨伞,如果预报将有降雨,它就会在大门旁发亮通知主人;能够联网更新版本的电子书;能够监测土壤湿度并按需补充水分的花盆;能够监控食物储藏数量并且进行相应预定的冰箱;能够远程开启以及调节的热水器、电灯、恒温器,等等。

  计算机运算能力和互联网接入还可以被编织进衣服,或者被整合到其他可穿戴物品中去。因此,我们可以想象这样一种外套:当主人在脸书网上收到其他人点赞时,外套会给主人一个小小的拥抱,或者能够测量距离、消耗热量、心率并且把数据传输给手持设备的T恤衫。拥有图形界面的互联网手表也已经面世,简单的利用传感器监测身体活动的健身手环在今天更是随处可见。对于喜欢极限运动的人,如今的护目镜不仅可以用来提供物理防护,还植入了加速计、陀螺仪、GPS定位系统以及蓝牙。同样还有整合在眼镜上的光学头戴显示器,比如谷歌 Glass。但是为什么止步于眼镜呢?有人正在研发直接把影像投射在眼睛视网膜上的技术(用户会看到物体悬浮在自己眼前)。视网膜显示技术指向了另一种嵌入方式,这种提议在最近的一次会议上让我们感到诚惶诚恐。一位八十多岁的老人在演讲过后找到了我们,愉快地向我们吐露心声“如今我连上了互联网”。一开始,我们以为他只是在表达自己终于加入了全世界30亿的网民大军。他一定是发现了我们的无动于衷,因为接下来他拍拍自己的胸口,带着一份拥有高科技玩意儿的自豪感告诉我们,“我的起搏器是和医院联网的,他们远程监控着我的心脏”。这位先生是微型联网处理器的早期尝试者,这种处理器通常被植入人体。把迷你电路装进人类或者动物的血肉之躯——测量、监控、配药、收集并传输信息给专家、病人或者其他系统。商业世界也在使用类似的技术。比如,通用电气公司的“工业互联网”——把传感器装到机器上,把大量数据传送到云端,把物联网和大数据结合到了一起。以上这些变革,就是我们所指的日益普及的设备。首先,平板电脑和手持设备的数量都在迅速增加,意味着更多人可以通过互联网来获取实践经验。其次,同样显著的变化在于,微小尺寸的处理器和通信部件被安装到机器上、建筑物里、人类动物身上、衣服上以及各种日常用品上,这些应用为专业人士提供了种种帮助(其中当然包括医生、牙医、兽医、眼科医生以及建筑师)。据估计,到2020年,联网设备的数量会达到400亿到500亿部,这会让我们再次见证指数级的增长。1943年,IBM的创立者托马斯·约翰·沃森曾经说过“这世界大概需要五台电脑”。六年后,一本知名期刊《大众机械》(Popular Mechanics)预言说“未来计算机的分量可能会比1.5吨更轻”。由此看来,我们已经走过何其漫长的一段路。

  4.8 愈发紧密连接的人类

  当连接到同一个互联网的人数几乎达到30亿的时候,会引发重大的变化。在下文中,我们罗列了许多人类互相连接之后所做的事情。毫无疑问这个清单无法穷举所有可能性,但我们主要关注那些对专业工作产生影响的方面。这些类别之间有许多重合的部分。我们的目的在于让大家对网络世界所发生的事情有所知晓,并非要提供一个无懈可击的分类清单。

  沟通

  搜索

  社交

  分享

  组建社区

  协作

  众包

  竞争

  交易

  首先,网络世界让人类可以借助新方式,更大规模地进行各种沟通。目前电子邮件和其他形式的在线信息传递非常高效,语音呼叫(传统电话)的重要性正在降低。比方说2014年,每天人类要发送1960亿封邮件(实际上,平均到每个人身上也有28封)。把这些方法跟视频通话(Skype)和网真(正在稳步发展)放在一起考虑,可以很清楚地看到专业人士和共事方以及服务对象之间的沟通方式正在发生改变。现代的专业工作是在一个由书信往来、面对面会议、固定电话主导的时代发展起来的,但在21世纪,这三大经典沟通手段已经过时。专业人士的工作惯例也已经完成相应的转型了。网页带来的影响也同样巨大,它已经成为大多数人搜索问题时的首选端口了。谷歌几乎无所不能,图书馆和百科全书——这些专业人士在19世纪、20世纪的首要信息来源——已经在很大程度上被谷歌取代了。

  然而,一场更大的革命正在上演,新一代的互联网用户,和他们的前辈非常不同。

  早期,也就是在20世纪90年代,人们只是网站运营方选择提供的内容的被动接受方。而现在,用户则直接参与并做出贡献。读者也可以是作者,接受方也可以是参与者,用户通过不断增加的各种系统生成内容,再提供给其他人。比如说,人们开发出了各种平台让用户可以进行在线社交。这些系统——最著名的是脸书网,拥有13.9亿用户(地球上每6个人里就有1个脸书网用户)——为那些希望便利地、频繁地保持联系的人们提供场所。用户使用社交平台的强度让多数40岁以上的人感到困惑。通常说来,用户会发布关于自己的信息——新闻、照片、更新、观点以及其他——世界各地的朋友圈子都可以看到。通过这种方式,社交网络已经主导了亿万人的业余生活。连接之后,使用社交网络的人类,通常也会进行分享——照片、视频、幻灯片等。这不是一个可以忽视的活动。每分钟里,超过300小时的视频资料会被上传到YouTube(在线视频短片资源库),这项服务目前拥有超过10亿名用户。互联网用户们分享他们的想法、思想和经验——无论是琐碎的,还是生死攸关的——这一切都是在线完成的。其中有些是通过博客来完成。早在2011年就已经有1.8亿条博文了。在推特这样的社交平台,大约2.88亿人通过不超过140个字的短文来分享信息——平均下来,每天的推文大概有5亿条。许多基于网络的互动都是短暂的、稍纵即逝的,搭建在线社区正在成为一种常态。之前已经介绍过脸书网,已经成了许多类似社区的大本营,LinkedIn也是如此,它常常被称为“成年人的脸书网”。这个网络针对的是职场人群,拥有3.32亿用户。脸书网和LinkedIn都是相当普遍的平台,向所有互联网用户都开放。除此以外,我们也看到不断涌现的各种经验社区——有着共同兴趣爱好的人们在线上聚集起来(工作或者兴趣爱好相关),以异常透明的方式来分享他们的日常经验、见解、成功、失败、希望、失望以及抱负。比如说在Patients Like Me上,医疗服务的接受者根据自身经验,彼此分享各种建议和指导。有时候专业人士还会对外行的经验进行补充。可汗学院就是个很好的例子,学生在接受老师正规指导的同时也互相学习。还有些社区设置了准入门槛,只接受专业人士加入——所谓的实践社区。医药领域的Sermo和法律领域的Legal OnRamp都是非常好的例子。在这种模式下,用户数量会相对较少,因为这些社区并没有向公众开放。这将会成为专业人士们的无价知识宝库,传播着各种艰深课题或者令人感兴趣的技术领域的思想。

  人类实现连接之后,最为激动人心的成果也许就是我们能够实现大规模在线协作了。想一想“维基”的概念。维基一词来自于夏威夷语(wikiwiki,意思是迅速),在维基的网站上,每个用户都能够直接修改和增加内容。最为知名的维基网站应该是Wikipedia(维基百科),“所有人都可以编辑的免费百科全书”。维基百科收集了用280种语言写成的3500万篇词条。据说它每个月有接近5亿人次的访问量,有超过69000名主要在线贡献者,长期对各种信息进行完善,并且添加互相参照和引用信息。这种很大程度上自发的行为被称为“大规模协作”。一开始许多怀疑论者并不认为维基百科能够成为值得信赖的信息源,如今它已经成为一种被广泛接受的可靠知识库,而这些信息都来自于一群自查自检的热心人士。大规模协作的核心概念在于,大量互联网用户因为共同的目标而聚集到一起,共同去协作完成一些相当规模的项目。在软件领域也可以找到颇为知名的实例。比如说Linux,这一最为广泛使用的操作系统,就是10,000名开发人员大规模协作的成果。他们已经一起写了超过1700万条代码。大规模协作不仅能够带来稳健、精确、及时的信息,而且并不受限于那些传统的学术或者发布方法。编辑们通常很少会介入,大量的信息和知识通过革命性的方式被组织成文件和软件形式。贡献者持续性地修改和补充,作为一种审核,保证了信息的时效性。

  当然,完成连接的人类所开展的合作、协作不一定非得是大规模的。21世纪的工作场景中,中等规模的在线合作也十分常见。15年前,如果专业机构想开发他们自己的在线工作平台,几乎要花费100万英镑以上,用去至少半年的时间。如今这种在线共享平台使用现成的软件,花上几分钟就能设置好。这样一来,即使身处不同国家,人们也很容易成为复杂文献的共同作者。

  众包是另一种相关的生产形式。许多人被邀请参与完成一些具体的项目,但项目的完成又不完全取决于某些个人或者传统机构。一种常见的做法是,把大型任务分解成便于管理的子项目,再邀请用户来完成这些子项目。众包利用人们聚合而成的网络来解决具体问题,完成细分工作,甚至为某些提议进行融资。我们再次看到,这些都具备了高度的协作性。各种重担得到了分担:一个问题、一件工作,或者一笔开销被分解开来,一群人共同挑起了担子。众包和大规模协作的概念有一定的重合,但一个众包项目往往具备更加清晰的任务范围和时间表,同时个人或机构明确委托并邀请其他人参与贡献。现在有许多公司专门从事众包业务。比如说CrowdFlower,据说有几百万人可以一起工作,去清理不完整的或者一团糟的数据包;Mechanical Turk是一项亚马逊网络服务,可以通过它向互联网用户发送需求来完成目前计算机做不到的事情;在Watsi网站上,病患可以向所有捐款人募集医疗费用。

  这种社交、分享、社区以及协作所显现出来的无私本质是令人震惊的。表面上看,这种合作精神驳斥了关于人性的流行观点——假定大多数人类是自利的。再进一步,这似乎也在挑战古典经济学思想——假定人类都是追求自身利益最大化的,如果看不到明显直接的回报,人们不会为其他人做出贡献。网络上的学术评论界的领军人物尤查·本科勒(Yochai Benkler)在他的著作《企鹅与怪兽》(The Penguin and the Leviathan)中,努力为这种明显的慷慨行为寻找合理解释——“合作精神战胜了自利的念头”。他这么说:

  互联网已经使得社会性的、非市场化的行为从工业经济时代的边缘,转而成了信息经济时代这个连接起来的世界的真正核心。信息和新闻、知识和文化、以计算机为媒介的社会经济活动,已经成为了我们生活方方面面的基石——从追求民主和全球公正,到商业媒体领域的新潮流,再到最先进经济体的顶尖创新。互联网已经颠覆了信息的创造方式以及人类社会的知识基础。

  究竟是什么激励着人们表现出这些“非市场化”的行为?尤查·本科勒对此的解释是一个有用的起点:“人们免费贡献出自己的时间和精力,因为他们认为自己在做正确的事,因为他们认为贡献是公平的,也因为这样可以加强他们的身份感和社区归属感。另外还有一点很重要,因为有趣。”但是,并非所有的网络都支持合作。有些网络反而创造条件并鼓励人们互相竞争。供应方利用网络列出他们的产品和服务,使得自己和其他竞争者一起参与排名,也让接受方能够借此搜索到他们。我们在医药领域看到的BetterDoctor和ZocDoc就是这种类型。在其他网站上,接受方可以主动将服务方进行对比。比如说在Kaggle上,接受方提供数据给这里的统计员们,由统计员们互相竞争来提供最好的分析。InnoCentive使用的是众包精神,邀请人们互相竞争,为一系列难题提供解决方案。

  最后一点,这些连接起来的人类,在网络上进行大量的交易。我们在此并不单指在线零售购物,尽管这类交易已经占到英国零售总额的13%到15%。更加值得注意的是,如今交易和交换的直接参与者都是个人,供应链上满是各种批发商、零售商或者其他中间渠道。eBay作为一个在线拍卖和购物网站,是这方面最好的例子。eBay成立于1995年,拥有将近1.5亿活跃交易者,既有偶发性的也有成熟的用户,在这样一个电子交易市场里进行购买和销售活动。光是2012年第四季度,就有价值191亿美元的货物在eBay上完成交易。目前有超过7亿种商品在eBay上等待出售。在这里看不到实物市场,也看不到任何存货的踪迹。eBay同时也是一种很好的服务形式,解放了所谓的“潜在需求”。目前eBay上所完成的交易活动,并不是因为eBay把所有事情变得更简单之后,用户改变了他们在互联网时代前的行为转而开始使用eBay。但事实远非如此,eBay其实是为1.5亿用户中的许多人创造了一个全新的市场。它帮助释放并且满足了潜在的交易需求,而这些需求从前并不明确存在。

  与在线零售交易系统有着紧密联系的是,许多在线服务都使用信誉评价系统,客户可以为供应商打分(有时也反过来)。这是一种鼓励诚信经营的有效手段。目前,许多专业服务领域都已经使用在线信誉系统了。同样,在一般的交易中或特定的专业服务领域,在线比价系统也受到潜在客户的高度欢迎。在网上搜索商品或服务的最低价格已经成为一种普遍现象;反过来,这也可能促成一笔在线交易,或者帮助客户在与传统供应商进行面对面谈判时更有底气。

  总之,当将近30亿人通过同一个网络将彼此连接到了一起,他们的沟通方式和搜索习惯都会变得和互联网时代之前非常不一样。除此以外,人们还能够用新的方式进行社交、分享、组建社区、合作、众包、竞争以及交易,这些活动的规模在虚拟世界里是无可比拟的。像推特、脸书网、eBay以及YouTube这样的系统和服务,都成了家喻户晓的名字,它们都是人类完成连接后所创造的杰出服务案例。这些服务20年前都不存在,但如今有几十亿人在使用这些服务。它们已经改变了,并且还会继续改变我们的生活和工作方式。《HOW时代:方式决定一切》(How:Why How We Do Anything Means Everything)一书的作者多弗·塞德曼(Dov Seidman)说得对,“人与人之间的连接永远不会减弱”。有两个简单的预测使得人与人之间的连接可能会更加紧密。第一个预测是互联网用户的数量将会持续增加;第二个预测更重要,即大多数联网用户对于本章所讨论的以及类似的系统的依赖程度会稳步增加。

  4.9 纵观五十载

  离完成对信息技术及其对专业人士相关影响的理解还差最后一步。一部分是针对那些可能会这么说的人,“我们见过这世面——20世纪80年代——没什么新鲜的”一部分是为了帮我们形成一个概念——技术在50年里对专业工作所产生的各种影响。

  首先让我们倒回到20世纪80年代,想一想那时各种专业工作领域的专家系统和人工智能。在那十年间,我正参与到人工智能和法律的核心开发工作中。对于人工智能来说,这是激动人心的时期,这也是从那时起就被叫作GOFAI(出色的老式人工智能)的鼎盛时期。人工智能这个术语是1955年由约翰·麦卡锡(John McCarthy)正式提出的,在接下来的30年里,许多系统、方法、技术都被归纳到这个大范畴里(以下括号里是20世纪80年代中期所使用的对应名称):处理并翻译自然语言(自然语言处理);识别所说的单词(语音识别);玩复杂的游戏比如国际象棋(博弈);在物理世界里识别图片和物体(视觉和知觉);从范例和先例里学习(机器学习);能够自己生成程序的计算机程序(自动程序设计);对人类用户进行复杂教育(智能计算机辅助教学);设计开发出能够模仿人类肢体运动的机器(机器人);智能解决问题以及推理(智能知识型系统或专家系统)。我当时在牛津大学的项目所关注的就是最后这个类别的理论和逻辑层面——专家系统在法律领域的应用。我们对这些概念进行梳理,因为计算机应用程序能够——至少原则上有能力以人类专家同等或更高的标准——解决法律问题并提供法律建议。1988年,我们从实验室出来走进市场,共同参与开发世界上第一台商业化的法律领域的专家系统。它是法律这个复杂领域的第一个电子法律顾问。最不寻常的是,尽管这样说有点自吹自擂,我们创建了一个问题解决方案,它在各种重大方面的表现要好过律师(这个领域的专家),也就是它知识的来源。完成那个项目之后,我们的兴趣拓展到了税务专家系统以及为审计师设计的系统。再一次,我们深度参与了这些能够以高水平完成专家任务的系统的开发工作。同时,我们也密切关注着正在取得重大进步的医学领域。这些早期的成功非常振奋人心。

  然后我们就进入了“人工智能的冬天”,在这一时期AI的发展似乎停滞了。显然在专业工作中,30年过去了,这类专家操作系统远不如我们当时所预期的发展得顺利。出了什么问题?为什么从那时起,我们在法律、税务、审计领域所看到的专家系统如此之少?为什么这一伟大的愿望没有成为现实?这和商业化程度有关——这些系统的开发成本都非常高昂(为了开发系统,专家需要投入大量时间),当律师和会计师事务所的利润都越来越丰厚的时候,整个行业没有理由去拥抱创新科技,来损害他们的连续胜利。然而,如果就此简单地认为这些系统没有市场那就太缺乏远见了。我们认为还有另一种解释,即用特定的角度来观察技术和专家决策方式的发展历史。按照这种观点,根据专家系统所采用的核心技术来评估其可用性是非常局限的。换个角度想一想,可以用两种非常不同的方式来描绘专业工作领域的专家系统。第一种被我们称为“建筑学”——根据所使用的特定方法和技术对系统进行分类。比如说,20世纪80年代,人们对在系统里构建知识结构的各种方式的相对优势有过大量的辩论(有些人认为“逻辑编程”要胜过“语义网络”)。当评论员和学术界争辩说法律、税务、审计领域的专家系统已经失败的时候,他们所指的常常就是,从“建筑学”上来说,基于20世纪80年代的技术所开发的大多数系统,其实从来没有真正离开过实验室。但还可以用第二种方法来定义专家系统,那就是“功能性”。基于这种观点,这也是我们更加认可的角度,即我们对系统的描述与技术无关,而是基于它所能实现的功能。我们对于专家系统的功能性定义从20世纪80年代中期起,基本是这样的:“使用计算机技术,使得稀缺的专家经验和知识能够被更多人更容易获取。”因此,问题的重点并不在于所使用的技术,而在于系统能实现的功能。如果我们接受这种功能性定义,那么如今所取得的相关进步就显得更加积极了。我们来聊聊许多已经可以在网上找到的专业服务。最朴实的那些使用的技巧包括核查清单、流程图以及常见问答,复杂的专家经验如今对所有网络用户开放,并且附带解释,而且常常不收取任何费用。然而,20世纪80年代,当我们研究人工智能和法律的时候,根本无法想象这些系统,显然也是因为那时万维网根本还没有被发明出来。尽管它们并没有使用到我们那时所研究的技术,但它们满足了我们对专家系统的功能性定义,使稀缺的专家经验得到了普及。我们并不认为这些系统就是专家系统或者人工智能。相反,我们认为我们正在从各种方面利用信息技术,就像20世纪80年代的我们在探索如何在专业工作领域中利用计算机。随着技术开发和吸收速度不断加快,移动设备上的应用程序越来越普及,专业内容、指导以及材料都会比我们在20世纪80年代能够预见到的更加唾手可得。

  我们还有一个观点:网页的发明,把针对专业工作领域计算机的开发重点,从人工智能和专家系统方向转移到了系统进化(许许多多网站)——工作方式完全被颠覆。虽然还处于早期阶段,但无论使用哪种核心技术,这批新的系统和服务已经证明了它们对非专业人士以及专业人士的巨大价值。它们的业务水平可能还不及专家,但它们已经非常具有实用价值了。

  把主流的网站先放在一边,我们现在可以发现,为了大幅提升第一批为专业工作开发的人工智能系统(专家系统)的服务水平,所需要的不仅仅是更强大的系统,更需要变换思路。总的来说,第一批专业工作领域的人工智能开发团队——从20世纪50年代至80年代——试图明白人类智慧所包含的知识和推理过程,并且试图通过计算机系统来复制它们。20世纪80年代的主流方法是以某种方法(通过“知识获取”或“知识工程学”方法)从人类专家的脑袋里挖掘宝藏,然后把他们的知识和经验装到系统里,通常使用决策树的结构,方便为用户提供导航。他们取得的成果是非常惊人的,但是商业或实际应用却相当有限。我们相信下一批人工智能系统不会基于GOFAI当年的技术和研究成果。我们期待着更加充满抱负的应用,而且来自于非常不同的设计理念和概念。

  为了掌握非常可能出现的方法上的变化,我们很有必要来探究以下两种可以使得机器在专业工作中表现得更智能的方法。第一种方法是把人类的知识都变成代码,然后装进系统。这种方式,我们说过,正是20世纪70年代至80年代专家系统的做法;第二种方法是让系统拥有足够的能力来完成专业工作。从技术角度来看,第二种方式更有野心——开发出可以处理原始素材的系统。该系统无须预设任何解决问题的路径,仍然能够高水平完成任务。这些系统真的会变得非常强大,我们期待它们逐步被专业工作领域接受。大数据和Watson都是这方面有力的实证。

  对于人工智能在专业工作的前景展望已经广泛成为现实了。拿语音识别举例,20世纪80年代的观点是,为了让计算机识别语音,在某种程度上,它需要理解单词所处的语境,这样一来,计算机就需要对周围世界具备整体理解。比方说,对于两句同样发音但意思不同的口语,“She is a tanker.(她是一艘油轮)”,以及“She is at anchor.(她正抛锚停泊着)”,只有了解语境,计算机才能辨别这两个句子分别的意思。因为人类的语言辨识能力是基于语境的,因此曾经的观点认为人工智能最终也将依靠模拟人类的智慧,学习人类处理信息以及考虑周围环境的方式来实现。这将要求系统具备常识以及通识。但是,语音识别最终却是通过蛮力运算、海量数据存取能力以及统计学来实现的。这意味着,比如说,一个好的语音识别系统听到这样一句话“My last visit to the office took two hours too long.(我上一次回办公室路上花了两个小时,太久了)”,能够正确拼写出发音相同的“to”“two”和“too”。它能够做到这些并不是因为它像人类一样理解使用这些单词的语境,而是因为它能够根据统计数据来判断,“to”比“two”或“too”更有可能和“the office”连在一起使用。这种统计概率通过在数据库里进行迅速搜索、排序来计算完成。这是大数据的一个早期实例,机器翻译的开发思路也是类似的(如今已经广为采用,比如谷歌翻译)。

  相似的,许多其他方面的人工智能,也是借助蛮力运算以及海量数据存取能力,而不是通过模拟人类思考过程,来帮助机器去完成那些通常被认为需要一定智慧才能完成的任务。推而广之,我们认为专业工作领域的系统进化也将由蛮力计算来推动,把巨大体量的历史数据作为运算基础。这些系统将提供高质量的建议和指导,但是它们并不像熟练的专家那样去推论或工作;不会去模拟人类思考和推论的过程;更不会拥有常识或通识。这些系统将表现出色,但是它们和人类实现智能的方式是不一样的。

  在这种观点之下,我们应当重新审视人工智能。对于许多评论家来说,人工智能的冬天只是AI死亡终结的婉转说法而已,但现在看起来AI并没有过时。它只是进入了冬眠期,储存着能量,在地底下安静缓慢地工作着,等待着相关技术发展起来,直到足以满足早期AI科学家们的最初想象。在过去几年里,寒冬过去,冰雪消融,我们看到了一系列重大进展——大数据、Waston、机器人、情感计算——我们相信这些都将推动AI新一轮的发展。

  总的来说,从20世纪70年代后期开始,专业人士的工作随着信息检索系统的出现开始计算机化。然后到了80年代,专业工作的第一代AI系统出现了,主要关注点在于专家系统相关的技术。在20世纪90年代的十年里,重心又转移到了知识管理,专业人士不再满足于存储、取用原始素材,他们还管理起了专有技术和工作实践经验。进入2000年,谷歌成了专业人士首选的搜索习惯,甚至发展成了从业人员搜索素材、解决问题时不可或缺的工具。21世纪前十年,我们期待着大数据和搜索方面取得巨大进步。而我们认为,进入2020年以后,专业工作领域将会产生并采用新一代的AI系统。

目录
设置
手机
书架
书页