当前位置:首页>校园文摘

IBM沃森负责人Mike Rhodin:谈人工智能的未来

文章来源:本站原创 作者:网络 发布时间:2016年01月25日 点击数: 字号:

IBM沃森负责人Mike Rhodin:谈人工智能的未来

没有什么事件能比2011年1月14日沃森在《Jeopardy!》节目中打败两位传奇冠军更能昭示人工智能的到来了。最终,机器人比我们还聪明。至此,沃森已经发展成IBM的增长引擎。

以下为采访正文:

Peter High:许多人还记得沃森曾经的辉煌战绩。大约一年多以前,IBM决定成立你现在领导的沃森团队(Watson Group)。公司给这个小组投入了十亿美元的启动经费。将沃森转为一项业务的愿望由来已久吗?

Mike Rhodin:如果你看到我们一直在做的事,你就知道,从技术角度来看,这正是IBM Research 的重大挑战,即追求人工智能领域众所周知的「开放领域深度Q&A问题」。这个问题最初源自上世纪40年代约翰 冯 诺伊曼(John von Neumann)的评论。在他的体系结构变成现代计算基础之后,他在40年代末时评论说:有一天计算机能回答任何问题。接下来的六十年,计算机科学家们一直致力于找出实现他所提出的观点的办法,想办法搭建一个以广泛领域知识为基础的问题回答系统。这就是沃森系统发端于IBM Research 的真正动力。一路走来,我们决定有必要找一个证明你可以在开放领域回答问题的证明点。《Jeopardy!》这个节目就是一个很棒的例子,节目里的题目很广泛,有许多不同类型的问题,以有趣的方式使用自然语言,堪当IBM Research 小组技术和突破的最佳见证者。因此,我们将《Jeopardy!》放在了首位。 

节目之后,我们对比赛结果欣喜若狂。这不是定局。 每件事上,使用任何一种概率系统都会存在某种程度的运气,但是,我们知道我们拥有一个在节目中表现出彩的系统。我们很高兴能够它能战胜两位顶尖冠军,两位绝顶聪明的人。

比赛后的两年,我们进入市场现有状态(in-market)测试期。我们开始与少数公司合作,他们已经与我们接触过,想要用这种技术做实验,不过不是玩游戏,而是解决问题。他们中的大多数都来自医疗领域。行业名人,诸如癌症领域的Memorial Sloan-Kettering 和MD Anderson中心, 普通内科的Cleveland 诊所,他们都开始与我们合作,探索如何将比赛系统中的东西转化成能用于医疗行业的东西。我们尝试了好几年,这几年也给了我们信心,所以我们在2014年宣布了一项商业计划,成立了沃森团队。

医生日常工作,收集病人的病历资料,以这些资料为基础,建立起一个值得信赖的假设,并对病人做出诊断。他们正在寻找可以帮助他们解决医疗行业特殊难题的系统,也就是需要处理的信息量:新研究和发表文章的数量已经完全超出医生更新的能力范围。仅2015年,我们就生产了大约700,000份新的医疗参考文献。我敢肯定,所有医生都没有时间看完这些新文献。他们关注的是,我们如何使用在竞赛中得到证实的技术来帮助他们了解所有信息,如何利用这些信息来为病人提供更好的诊断治疗。这就是人工智能领域已经准备觉醒(之前已经沉睡了几十年)的首要线索之一,人工智能系统开始步入黄金时期。

这就是去年我们的启动过程。对于我们来说,这也是个非常重要的时间点,因为我们不仅已经决定将这项技术运用于医疗领域(虽然这个领域仍有巨大运用潜力),而且我们意识到能将这项技术运用于多个行业领域。我们选择潜在的应用对象的标准是:任何行业中,数据的积累已经超越了人工处理消化能力的任何职业。这涵盖了非常多的职业,鉴于当前信息生成的(巨大)数量。这一现状对我们已经显示得非常清晰。

做出启动这个商业项目关键决定的第二件事情就是创建开放生态系统:我们开放平台API,这样创业公司就能接触到这项技术,并在此基础上开始打造自己的商业。当我们启动沃森小组时,我们不仅拥有一直合作的早期用户,还有一些在项目启动之前,我们就想要让其接触到该技术的创业公司,这样他们就能加入,与我们一起讨论手头正在做的事情。至此,生态系统项目开始启动。我们有几百家建立在这一平台之上的公司,有超过一百家公司采用了市场解决方案。另外的约四百家公司正在发展中,他们会在未来一年左右时间里加入进来。

High:正如我理解的,沃森反映出人类做决定时的事件链:观察,解释,评估,然后做出决定。就给定主题,为了有适当的参考点来做这些事情,需要沃森具备知识语料库和组织内容。如何基于语料库做出决定?如何组织信息?当各种机构更大程度的利用你们的平台,上述提及的信息处理过程通常会有谁的参与?你预计未来还谁会参与进来?

Rhodin:关键突破在于我们可以给系统输入自然语言文本:参考资料,互联网,维基百科,网页。本质上,我们教系统去读文本。搭建系统过程首先是找出你所应用的领域。整理,就是用很多方式找出你职业范围内或那个领域内重要的信息源,然后将信息输入系统或让系统读取全部信息。

第二步就是创建训练系统的基准事实(ground truth)。可以类比一下你在学校时的经历。老师让你做的第一件事是读书。他们会做的第二件是问书中的问题,这样他们就能搞清楚你是否读懂了这本书。沃森运行的方式也大致相同:读取你认为相关的信息,然后你通过问问题来测试或训练它,检查答案,建立一定程度的基准事实。然后你继续用更多信息更新系统,基准事实也会随着时间的推进,与机器学习算法一起演进并不断学习。这里的想法就是,简单输入,你读取了大量信息,你确定你读懂了,然后你开始变成这方面的「专家」。系统的基础就是,你教系统读取,训练系统,然后通过使用继续学习——和我们的学习方式很像。这是反映了人类学习的过程。

为了搞清楚将什么信息输入系统,让目前在这个领域工作的专家参与这个过程很重要。比如,当我们和Memorial Sloan-Kettering癌症中心合作时,我们是在和世界一流的肿瘤学家合作。他们正在做的事情是将他们的知识传授给系统,而不仅仅在癌症中心使用该系统。比如,我们和他们合作打造的系统,泰国Bumrungrad医院目前正在使用,这家医院可以使用训练过该系统的世界一流肿瘤中心医生的最佳实践经验。对我们来说,这是我们所想的在全球范围内将专家实践经验民主化的方式。

部分过程是确定专业领域,然后确定打算参与这个项目主题的专家。围绕沃森以及类似技术的成功项目需要专家的参与。这不是个简单的IT项目,而是一个为专家,靠专家,与专家合作的项目。

High:沃森发现顾问(Watson Discovery Advisor),沃森分析( Watson Analytics)和沃森探索( Watson Explorer)是三大已命名的服务产品。你能介绍一下它们吗?

Rhodin:我先来介绍沃森分析。很多年来,我们都使用着不同的可视化技术,以定量的方式来描述信息和数字,制作图表以及其他有趣的事情。人们一直将之称为商业智能;这是一种仪表板化的技术。然后,我们开始在系统中添加预测性的分析能力,随着业务的不断展开,它开始成为商业分析( Business Analytics)。如今它已经是IBM的一项大业务。我们开始观察如何提升系统用户体验,如何利用自然语言处理技术以及沃森的理解和学习能力提升系统。我们采纳了商业分析的建议并将之与自然语言处理技术结合起来,这样人们就能询问有关信息源的问题。系统一开始会足够智能,随着时间的推移,还学会如何识别你想用来解决某个问题的正确数据源,学会如何推荐改善数据之道来获取更好的结果。我们开始将人工智能领域与商业分析融合在同一个平台上,那就是沃森分析的产品线。今天,这款云产品会先免费让用户试用,然后如果有人想继续使用,就需要相应的商业许可。

第二件产品沃森参与顾问(Watson Engagement Adviser),即一个人与知识库进行交互的框架。如果你想过,一个受过训练的沃森系统是什么,它其实就是一个知识库。它会不断阅读最新信息并及时更新。这款产品打造了一个如何进行互动的框架:问问题还是你来我往的对话。我们的系统已经进化成一个会话系统,你可以与它对话并从中学习。这些系统可以用于许多不同类型的信息。在我们的合作者生态系统中,有很多不错的例子,他们用它来做一些有趣的事情。

一家名叫Elemental Path的公司打造并推出了一款名为CogniToys的产品,这是一款和沃森连接的玩具恐龙。孩子们可以和自己的小恐龙交谈,这款玩具所连接的后端知识库不仅能够回答孩子们的问题,还能适应孩子的成长,确保给出的答案是符合孩子年龄段的。另外,这款玩具还能根据对话的信息追踪孩子们的成长发育状况。这只是使用我们生态系统的一个很好的交互应用案例。

上周在日本,我在舞台上和软银的Pepper机器人就银行业务问题进行了一场你来我往的交谈。它不仅能用英语回答我的问题,还能用日语和我的一位同事交谈。我们已经开始扩展沃森在多语种领域的参与交互能力,这样沃森将不只能使用英语,还能使用多种其它语言进行交互;每个季度我们都会增加更多语言。我们认为随着这些系统的进化,能够使用知识进行互动是很重要的。

我们推出的另一个系统叫做「发现顾问(Discovery Adviser)」。你可以将其看做是「提问题找答案」的相反方向。想一想,你在基于海量信息的基础上对系统进行训练,尤其是使用不同来源的信息时,你该怎样找到未填入的空白部分呢?你该怎样发掘并将那些尚未发现的事物的关系连接起来呢?该系统最初面向公众时的名字是「沃森大厨(Chef Watson)」,因为当时我们想创造一个能够和人们产生共鸣的东西,然后在消费者角度上看人们是否能够接受一个具有创造力、能够发现人类还没发现的新事物的系统或计算机。所以我们首先选择了烹饪作为范例,但该系统现在已经在石油和天然气勘探领域得到了应用,同时它还被应用于制药、药物开发和金属冶炼等,此外,它还是我们沃森基因学研究的基础,能够帮助我们理解DNA序列。发现顾问成为了「提问-回答」之外的另一个范式,它开始了解如何将不同数据来源的信息点连接在一起。

可以举一个制药行业的例子,你可能一开始会用医学基础对系统进行训练,然后加入所有已知的化学物质进行训练,再然后你会将一家制药公司所有未发表的专门研究作为训练资料;之后呢,你可能还会加入所有已知的相关专利信息,因为如果你是一家制药公司的话,你肯定不会期望自己正在研究测试的东西是竞争对手已经申请过专利的。而找到这些信息之间的联系就非常重要。

沃森探索(Watson Explorer)可以用来协助企业的内部工作,它可以将企业数据源中不同类型的数据汇集到起来,然后将这些信息通过API连接到基于云的沃森系统上,让我们可以在私有云中将这些不同的专有数据整合到一起。而这些私有云已经包含了共有云坏境所分享的信息和知识;它提供了非常好的可视化功能,并且还能在企业内部构建可以利用基于沃森服务云的应用。

High:你的工作涉及到了17个行业,包括医疗保健、制药、冶金、玩具制造和基因组学。你选择的这些行业有什么共同点?

Rhodin:一些行业内的数据生成已经开始超出了人类的能力范围,人类已不再拥有能力管理和理解所有数据的能力,这时候时机就成熟了,那就是我们寻找的关键因素。医疗保健在这方面显然已经是一个成熟行业了。我们认为法律方面也是一个比较好的应用领域。我们和汤森路透等世界上最大的几家内容公司也有合作项目,目前这些已经在进行中。我们有一个位于加州的合作伙伴Ross Legal,该公司帮助我们赢了一场和大学纠纷的官司,而现在该公司也已经在沃森的基础上构建法律解决方案。我们认为法律是一个很有意思的领域。另外,我们也已经开始为教育领域提供服务了,还有应用在汽车行业帮助用户理解保修问题的沃森项目。通用汽车CEO Mary Barra提到过,在她搜索一些他们汽车中出现的一些问题时就用到了沃森技术。我想做的就是推动这些事情的爆发,让人工智能技术变得无处不在,让Jeopardy!比赛将作为世界认识技术的起点而被载入史册,它让人们认识这些技术可以被应用到很多行业领域。与此同时,我们也开始认识到需要处理过量信息的问题,而这些技术就成了我们的完美搭档。

人工智能相关项目正在爆发式增长。每天我们都能听到有新的创业公司加入到这一领域,大量新项目都是从开源社区开始的。起初我想的就是——第三次科技革命就要从此开始了,我将其看作是一次信息革命。这些是将会伴随我们未来数十年的技术,而我们现在可能还处在这个四五十年技术发展期的第三年。

我认为,我们现在所见一切的未来前景是非常惊人的。人类和这些新系统的结合将能让我们解决其中任何一方都不能单独解决的问题。我们致力于继续强化和扩展这一平台。当我们一年前推出这个生态系统时,平台上只有一种API或服务,而现在我们有超过30种了。我们还在给这个平台增加新的模式,使其不仅能够阅读信息,还具有语音和文本双向转换、计算机视觉等能力。我们也开始让Watson学习新语言。我们从西班牙语和日语开始,后来又增加了巴西葡萄牙语,现在我们正在加入阿拉伯语,接下来将是法语和意大利语,德语也在计划中。我们认为系统能够使用多种语言进行交谈是非常重要的。你可以想象一下我之前提到的那种机器人翻译:你可以走到这种机器人面前,它能够识别你所说的语言并选择适当的语言与你交谈。

一些非常好的新功能也开始出现了。在我们开始进入医疗保健领域时,我们开发了可以将医疗保健大数据和医疗保健知识综合起来的新功能,并将这些功能集成到一个包含了全新应用和合作伙伴关系的平台上。我们已经公布了和美敦力、强生、苹果、CVS等医疗健康行业大腕的战略合作关系,它们中的一些也已经在使用我们正在打造的平台了。我们也在该领域进行了一些收购。我们拥有世界上最大的临床数据库,拥有超过9500万份病历报告。这些通过电子病历系统传输的临床数据可以进行识别或匿名,之后这些信息可以用于研究等目的。

然后我们开始搜寻其它数据源,我们着眼于引入图像数据进行图像诊断。你可以将其看作是放射检测类型的解决方案。我们收购了Merge Healthcare,然后将其超过300亿分医学图像录入到了沃森平台中。我们运用一些IBM研究所开发的突破性技术开始基于这些图像构建诊断功能,并且我们还和所有相关监管机构合作设计制作了FDA(美国食品药品监督管理局)批准的医疗设备。我们极大地扩展了医疗健康领域。

最近,我们开始进军物联网领域,并且开始思考如何将这些不同类型和不同来源的数据用于新的认知系统中。我们已经开始思考将其作为一条信息供应链:物联网中的传感器将生成大量数据;我们将通过分析来转换、过滤和翻译这些数据,并将其转换为信息;然后你就可以将这些不同来源的信息聚合起来构建认知系统以创造知识。简而言之,这条信息的供应链是:传感器→数据→分析→信息→认知系统→知识。我认为这条供应链将成为未来几十年应用创新的基础,并将在可见的未来内成为市场的热点。我认为VC投资也将转向其中。我认为和90年代互联网刚成为基础平台时涌现了大量创业公司一样,在这些平台上我们也将见证大量创业公司的诞生。我们又将经历一次同样的创业高峰。

High:有很多人写了关于在人工智能阵营与人工智能安全阵营(译者注:马斯克、霍金和比尔盖茨等)之间保持平衡的文章,这里缺一个更好的术语。提到那些适当平衡时,你是怎么想的?你是否觉得恐惧被夸大了?而正如你所说的那样,在宏伟蓝图的初期阶段,你是否认为像你一样的领头人和实践者以及和你一起工作的人也需要认识到这种快速发展的含义?

Rhodin:是的,是有很多文章,我确实觉得很有趣。一些写这些文章的人也进行了投资,所以这很有趣,一些评论文章制造了一些谣言。从商业的角度来看,我认为真正的问题是:无知的代价是什么?我确实相信任何技术下都存在管理和应用水平的差异。汽车是武器还是运输载具?都可以是。认识到技术创新的重要性是十分重要的。这关系到我们如何让社会进步。确保我们以恰当的方式利用技术是我们作为创新者和领头人的部分工作。

High:我也很好奇,你用了互联网做对比,阐释了发展早期的情况:人们将会使用这些API,开发新业务,大量风险资本也将进入这一领域。我也想起在你描述沃森和其它类似的人工智能工具所能带来的价值时,你提到最大化利用这一平台的公司和完全不使用这一平台的公司之间会产生巨大的差距,而光是为它们合成和开发的巨量信息和知识就足以形成天壤之别。你怎么看待那些更早采用人工智能的企业组织所引起的差距呢?或者说早一点使用这一技术的国家相对其它国家的差距?

Rhodin:我认为更早采用的总是会占据优势,但他们也需要忍受站在新技术前沿的困难,许多公司更喜欢做快速跟随者而不是尝鲜者。我们现在所看到的是我们已经和早期尝鲜者打了几年交道了。现在已经有快速跟随者进入了战斗。快速跟随者入场的时候就是经济开始快速增长的时候。早期尝鲜者却已经快他们一步:他们了解这项技术,他们开始飞速发展了。但快速跟随者也在开始进入其中。

我不会说因为平台,比如互联网,开放给所有人后会出现引起差距;平台是任何人都可以使用的东西。和任何人合作我们都很高兴。我们既和三个人组成的小型创业公司合作,也和收入数十亿美元的大型企业合作。这是一个完全开放的坏境。我认为很重要的一点是要让人们认识到这并不是一次潮流,而是真真实实的信息革命。而如果他们使用这些系统,我们也将在全球范围内开启知识的民主化。通过这种方式,我认为我们将看到那些已经停滞了很长时间的领域开始出现突破。我认为我们将会看到医疗领域的突破,看到法律系统运转上的突破,因为我们将能以一种全新的方式来应对复杂性。我们也将看到旧的商业模式被打破,新的商业模式也将随之诞生。就我个人而言,我为即将到来的未来感到振奋,我认为未来十年内我们将见到这一技术所带来的一些巨大进步。