本文共 7169 字,大约阅读时间需要 23 分钟。
在新智元举行的百人峰会闭门论坛上,微软亚太研发集团创新孵化总监程骉在会上带来了《对话即平台——智能医疗初探》的分享。
以下为程骉演讲实录。
程骉:非常高兴在这个场合跟大家见面,欢迎大家来到微软。我讲的题目和对话、智能医疗有关。智能医疗是非常大的话题,我今天跟大家分享我们在这个领域的一个研究项目,所以我写的题目是“初探”,不会覆盖所有的话题。
自我介绍一下,“骉”是我父亲给我取的名字,这可难为了我从幼儿园到研究生的所有老师,他们大部分不认识这个字。我们上大学的时候,数学老师性子特别急,他点名点到我的名字称三马,以致大学同学都叫我三马,“骉”这个字不大常见。我在微软亚太研发集团做创新孵化这一块,比如有一些好的研究成果怎么在中国落地,我们团队同时跟微软的销售和市场部门以及外部的合作伙伴沟通也非常紧密。
大家可能留意到,微软前两天发布了重磅新闻—— Microsoft Translator(微软翻译)做了一次重大更新。它其实发布已经有很长时间了,但这次更新有一个非常牛的功能,就是多人、多语言、跨设备的现场翻译(英文叫Live feature),可以在几种不同的场景下使用。比如导游说不同的语言,你问路它能够实时给你翻译。Microsoft Translator目前支持包括中文普通话在内的9种语言的语音输入,将近60种语言的文字翻译,而且可以多人现场对讲,支持多达一百人的实时翻译。这以前只在科幻小说里面听说过,现在科幻慢慢变成现实了,人与人之间面对面的交流障碍在逐步被消除。
我们之前发布了微软助理小娜(英文是Cortana),各个平台上都有,安卓手机和iPhone、iPad 都有这个应用,尤其是在Windows10上,能够帮你做一些其他事情。
前两天发布的是我们等了很久的 Cortana Devices SDK智能套件,这为Cortana在各个平台、各种设备上的推广将会起到非常大的促进作用。之前有很多公司希望我们能早日发布Cortana的SDK,这次很好地满足了大家的期待。
顺便说一句,小娜在中国还有个比她名气大得多的“妹妹”,咱们现场的朋友有没有没听过微软小冰的(笑)?2014微软小冰首次在中国发布,小冰到目前为止拥有四千万用户,我了解的记录是对话的平均轮次是23轮。其实在很多人眼里,小冰早已超越了一般的人工智能。她不仅仅能满足你一些功能性的提问,还能机智地反击你的调侃、陪你聊鸡汤聊感情。2015年发布的日本版小冰叫Rinna,中文翻译成“凛菜”,现在有20%的日本人经常跟她在线上聊天。
前两天正式发布的是美国版小冰,叫Zo,一个月前开始测试上线,到目前为止已有超过10万用户在线上跟她聊天,有超过五千人单次超过一个小时的聊天时长。单人单次记录最长能够有多少个轮次?1229次!聊了多长时间?将近10个小时,9小时53分。这个数字一出来我们也吓了一跳,这才刚上线一个月的时间啊。
微软对人工智能真是非常重视,大家可能看到了今年九月份我们宣布了一个新闻,跟AI相关的产品部门包括必应、Cortana等的团队和研究部门整合成了一个五千人多的大团队,微软人工智能与研究事业部 ,目的就是要普及人工智能。公司的战略是移动优先、云优先,但是对这个团队而言是智能优先。现在,沈向洋博士在领导这个团队。
25年前微软研究院成立的时候,比尔·盖茨先生有一个梦想,他希望计算机有朝一日可以看懂、听懂和理解人类,这一宏伟目标也成功吸引了大批顶尖人才加盟微软研究院。
经过这么多年的厚积薄发,我们取得了一系列令人震撼的世界纪录。比如,在著名的计算机视觉(图像识别)ImageNet竞赛上,去年微软亚洲研究院的ResNet技术超越了人类记录,错误率只有3.5%,而人的错误率是5.1%。而今年10月,微软在语音识别能力上也取得了突破性进展,语音识别正确率达到了人类速记员的水平,跟人类速记员的最好纪录是持平的。
微软的愿景很大胆:我们计划在虚拟助理、应用、服务和基础设施等多个领域实现真正的人工智能系统。微软希望向所有人提供人工智能技术 ,包括消费者,企业和开发者,让他们都能在这些技术中获益。我们所有这些服务,打包以API的形式提供给开发者,方便其制作各种智能应用。我们统一称这些在微软云Azure上运行的服务为“微软认知服务” 。
前两天有报道,CB Insights 预计2017年人工智能的十大趋势哪个最有可能成功,第一位的就是智能聊天。
另外一个热门就是医疗行业。在行业应用预测中,医疗行业排在第一位,医疗行业 2015年是最火的,2016年稍微有点下降,但在各个行业里面它牢牢占据着第一位。我今天讲的跟这两个都有关系,一个是聊天,一个是健康。
聊天机器人。大家都觉得这是一个方向,各家都在研究,从微软的角度来讲,我们认为有两个维度,一个是智商,另外一个是情商。用户跟小冰能聊那么长时间,就是情商的体现,她能一直跟你对话。昨天在南京跟大家聊天,很多人没用过小冰聊天,后来聊起来,觉得真有意思,小冰回答怎么这么绝?我都说不出来这种话。
在另外一个维度上,我们其实不需要那么高的情商,但是需要提高效率,提高生产力,这是小娜实现的功能。
小冰的平均会话次数是23次,是其它类似产品的10倍以上。有一个非常有意思的事跟大家分享。
小冰最初上线的时候,所有的对话数据都是从网上抓的,百分之百都是从网上学来的。所以刚开始跟小冰对话,她经常出言不逊,因为她都是从网上学来的。两年多的时间很多人跟她对话,慢慢她从用户那里学来的占到45%,从网上学来的下降到55%。她能够通过跟人类不停地对话,自己学习人类的智能。
正是因为对话聊天这么重要,所以我们提出了CaaP(Conversation as a Platform),即“对话即平台”战略。通过人跟聊天机器人进行各种交互,我们产生了平台的生态系统,以非常自然的方式达成新的人机交互、提供搜索和服务的新入口。
谈到聊天机器人,一般认为有三层逻辑结构:第一层是通用的对话,就是小冰完成的功能,跟你闲聊,有些情感的分析,也会有一些个性化的对话,跟不同的人会聊不同的内容。第二层就是智能的问答和搜索,需要获取一些信息,包括一些智能客服也属于这个范畴,是问答Q&A的范畴。最后一层是需要更多的专业知识来完成一些任务,这个一般需要多轮问答,也需要对话管理,这是比较高的层次。我们下面讲的东西跟第二层(问答)有关。
医生在问诊的时候经常手忙脚乱的,需要回答那么多的问题,而且经常是重复性的问题。患者也会困惑,等那么长时间两分钟诊疗就结束了。这对大家来说也许都是非常熟悉的场景。
医疗这个市场到底有哪些痛点?患者对一般的社区医院信任程度有待提高,有病直接到最好的医院找专家,其实专家花很多时间解答一些基础的知识并非必要。我们经常听到的是三甲医院的医生工作量巨大,又要搞科研又要看病,问诊的细致程度和工作状态不能得到充分的保证,很多日常小病也去找他们,无法最大程度发挥工作价值。
社区医院的医生也有痛点,他们的痛点是患者的信任问题。现在国家提倡建立家庭医生制度,医生除了现有的工作以外,还要每个医生支持很多户家庭,执行起来难度较大。从国家层面来讲,国家很想解决这个问题,连续发布了几个文件,提出分级诊疗,推进家庭医生签约服务,但是推行起来也有很多困难。
总结起来,这里面有很多重复性的问题:我们能不能够让我们的AI帮助解决一部分这样的问题。针对分级诊疗这件事情,我们专门做了一个智能辅助系统,比如基层医生的培训,提高基层医生的工作能力、提高他们的工作效率。怎么提高工作能力?建立知识库能够辅助学习,辅助问诊。从提高工作效率来讲,机器自动回复常识性的问题,再加上能够自动回访。不需要医生记着这个病人一周前来做过手术,我们的系统能记得对患者回访,从而提高医生的效率。
具体怎么实现?首先是数据源的接入,数据有三方面:第一,网上抓取的数据,这是公开非结构化的医学文本;第二类,是专家的知识,但是没有归档的;第三类,是半结构的电子病例。为什么说半结构?有一部分也是结构化的,比如姓名、身份证号,但是医生关于症状的描述这些东西都是属于非结构化的。
我们从这个数据源接入,去挖掘这里面的知识,当然这其中有好几类的知识。一类是事实与关系的知识图谱挖掘、问答知识挖掘,网上有一些Q&A能够自动挖掘出来,以及深度的知识挖掘。有了这么多知识怎么存储管理?要根据我们了解的知识构建知识图谱,根据医学问答建立知识的索引,常识知识的扩展,还有共享这些知识。有了这些知识以后,怎么样来做语义搜索?我可以说一句非常自然的语言,机器怎么样来理解?患者用自然语言描述得了什么样的病或者有什么样的症状,怎么根据这个来帮助诊断?
最后在应用层,有了所有构造以后,我们就能够实现点对点的自动回复、健康管理、以及医疗随访。
我们通过建立知识库和搜索,从医生的角度可以自动问答还有随访,最后患者跟普通医生建立信任。我们做了一个测试版的应用,是一个网页版应用,跟一般的搜索不一样,只要输入一句话,根据这句话把主要的关键词、实体找出来,我们会根据这个关键词找到最好的答案,结构化的信息都会在后面显示出来。比如这个问题是问糖尿病相关的,糖尿病是我们的关键字。另外我们把知识挖掘做成接口,API:包括文档怎么解析,怎么把实体抽取出来,帮助我们建库,另外还包括实体定义挖掘,包括概念化。之前研究院发布了两个相关的产品——Microsoft Concept Graph和Microsoft Concept Tagging模型,两个都是帮助建立广泛应用的医学知识图谱,建立比较专业的知识,而不是闲聊,这个是非常重要的。
其中当然有很多的技术挑战,不是一建立就非常好用的。一个是实体等价知识库,比如,同样的意思,拉肚子和腹泻都是一回事,但是我们要让知识库里面有对应的关系。还有实体概念的知识库,还有实体关系的图谱,我就不仔细讲了,其实还是有很多挑战,不是一帆风顺的。
微软亚洲研究院洪小文院长在很多场合讲AI+HI(Artificial ligence + Human intelligence),需要人来介入,让机器更智能,这样的学习管理工具也是帮助医生把他们的专业知识放到我们的系统里面去,是同样的道理。我们跟国内某三甲医院神经外科合作了一个项目,给他们提供了微信的接口。这是几个月之前做的,反响还是不错的。
这个项目希望可以让医疗的资源下沉,从三甲医院慢慢下沉到社区医院,让社区医院发挥更多的作用,让三甲医院的专家能够发挥他们的最大作用,把他们的时间最有效地发挥出来。好,就先讲到这儿,谢谢大家!
新智元创始人杨静提问:您的演讲里面提到微软也在做智能医疗方面的业务,IBM的沃森是一个典型的智能医疗项目,微软的智能医疗项目跟它们有什么区别?您这边的竞争优势在什么地方?像云知声也做智能医疗方面的项目,跟你们合作和跟IBM合作有什么区别?
程骉:这个问题非常大,我不能够完全回答。我只能解释一下我们这个项目的特点。首先,我们做的项目是非常本土化的,我们跟几家中国医院都有合作,沟通的过程中,我们发现一个很大的问题是国外很多的医学词语词汇不接地气,到这儿来完全没法用。我们在跟医院医生交流的过程当中了解到中外医学词汇是很不一样的,我们需要做很多的工作。
另外,微软全球研究院还有其它跟智能医疗相关的前瞻性的工作,比如,我们的一组研究人员正在通过人工智能,利用机器学习及自然语言处理,帮助全球知名的肿瘤学家整理所有可用的研究数据,为患者找出最有效和个性化的癌症治疗方案;还有研究人员正在用机器学习配合计算机视觉技术,让放射科医生能够更详细地了解病患身体内肿瘤的变化情况,包括北京的研究团队在癌症、疟疾图片分析这一领域也做了很多年,取得非常好的成果。还有利用Kinect进行体感康复的项目等等。
从公司的层面,微软也积极投身推动医疗行业数字化转型,我们有相关的同事负责这个方面的项目。
杨静:您的分享让我们第一次知道微软在智能医疗方面特别有企图心。我们也知道,以前,一些美国的智能医疗技术在中国的本土化应用中的确存在一些障碍,特别是像对病例的解读或者医学文献的解读,它们在中文的理解方面是有一定的问题的。还有医生和病人交互的过程中自然语音的交互以前可能也是一个障碍,因为没办法用中文来进行。现在,微软提供新的技术平台,可能在这方面有更多的解决方案,对于助力中国的智能医疗在地的发展,相信会有帮助。
程骉:跟以往的努力不同,公司现在更多关注的是如何将人工智能技术,结合我们基于微软云Azure的大数据处理能力,应用到健康医疗领域,提高医务人员的工作效率和辅助诊疗。我们从这个项目开始做一些相关的努力,包括刚才您提到的语音识别,一般的词汇语音识别我们做的还是不错的,准确率非常高。但是碰到医疗词汇如果没有这些医疗名词在库里面的话,其实机器是完全不懂的。我们也是希望由点到面慢慢扩大,从而做得更好。
杨静:微软在这方面的优势,微软亚洲研究院首席研究员周明老师是候任的ACL的主席,邓力老师、俞栋老师,还有黄学东老师都是在世界上顶级的语音方面AI专家。你们的技术一定能突破以往的瓶颈。不知道在座的嘉宾有没有对微软智能医疗的问题?
浪潮集团高性能服务器产品部总经理刘军:今天非常荣幸参加新智元百人会,我是浪潮集团刘军,负责高性能计算这块业务。我们在AI里面主要参与是作为后端计算设备的供应商,现在中国60%的Deep Learning服务器都是浪潮提供的。我今天非常感兴趣的一点是:微软在整个医疗这块跟AI结合有没有一个大的蓝图介绍?在影像这一块,浪潮的客户里面有很多对于AI和精准医疗结合有很多的需求,想了解微软在这一块的整体布局。
第二个问题:您这边也是创新孵化的负责人,微软做的非常好的产品和技术,有没有可能跟业界其它的公司比如像浪潮这样的有合作?
程骉:首先微软在医疗方面的整体布局我不敢说。但从研发的角度,之前我也提到了,全球而言,微软研究院其实有好几个团队都在做相关的研究。除了北京的团队之外,位于雷德蒙总部、英国剑桥,以及以色列的团队各自从不同的侧面进行相关研究,有些是医疗设备相关的或者是跟测量设备有关的,也有做图片分析的等。当然,微软在助力医疗产业数字化转型方面有着相应的规划,这个需要我们负责数字化转型的同事来跟大家分享细节。
我们这个研究项目的着重点是怎么来落地,在中国落地是非常难的事情,从技术角度来讲微软有很多年的积累,包括杨老师也提到在自然语言理解方面,包括图象识别、计算机视觉和视频的分析,这些方面我们其实技术上已经做得非常好了,但是怎么样来落地?借由一个项目能够把它由点到面做起来,有很多实际的困难。
对于跟浪潮或其他厂商的合作,因为我们跟销售部门也会有一些对外合作,所以如果有好的结合点,一定会往前推进以达到双赢。
红杉资本中国基金华东区总经理魏洪波:很荣幸参加这个活动,之前通过杨静总介绍,我对新智元专家群里也有一些了解。我们目前的业务以医疗语音助手为主,之前我们看到国内基于语音的公司有小i机器人,还有其他公司都在切银行和典型等,那么大家会是To B还是To C,怎么看待这两个不同市场的机会?
医疗这个领域并不太市场化,买单的人不太清晰,这个业务未来能快速变现还是未来也会去切像电信甚至电商作为语音助手这类的商业客户,我们怎么看待未来市场的商业延伸价值?
程骉:不同的听众问的问题角度果然都不一样,微软很多部门都做跟语音相关的研发,包括小娜团队,他们会从市场角度去看看有没有这样的应用场景能够帮助我们的语音技术实现应用。实际上,不同的行业我们都在切入,有很多的需求。我们目前的这个项目主要是To B的,你刚才说的点很重要,变现并不会那么快,但作为技术研究者,我们这个项目更注重的是怎么把这个技术实际应用起来。微软是一个技术平台公司,我们当然是希望我们的技术能够助力更多的企业和机构,能够落地真正起到一些作用,解决实际问题。
爱奇艺首席科学家王涛:医疗确实跟每个人息息相关,去医院看病病人太多,挂号非常难挂,对于医生来说时间非常有限,看一个病人五到十分钟。这个应用怎么来运营?帮助你挂号的APP有了,有些网站医生可以在线问答。咱们运营的模式是什么样的?完全是机器人助手,还是有医生在线上跟病人交流互动?有些病症看着都非常相似,但是真正的病因不同。比如,最近我小孩感冒了,不停咳嗽,去看病说血象正常,开了一些药不好使,后来又试,说这就是过敏性咳嗽。一个咳嗽可以看出来里面病因很难找,有时候不太好办。从技术上来说,比如传统医生望闻问切,我们怎么把测试的数据还有状况准确客观地反映出来?
程骉:非常好的问题,说到运营的模式,落地一定要解决这个问题。微软这个项目之前有很多积累,包括知识库建立、标签,这些技术都有。但是落地的话,从市场部、销售部那边有一些医院的客户找过来,我们也去聊,聊完之后发现这里面的需求非常大,真的是刚需。我刚才提到那么多的痛点,不管是患者、医生,还是政府都有很多的痛点,我们现在具体做法是:跟医院合作,也跟政府合作。我们跟医院和政府来谈这个事情,把这个技术给他们。这个项目本身是To B的,我们不是让病患直接去问问题得到答案,我们定位为辅助助手,实际给医生去提供一些参考,跟你直接到网页上搜索效果是不一样的,它会非常专业,我们是专门建这样的知识库,希望起到这样的助手作用,能够真正帮助解决这些痛点。
转载地址:http://yjqyx.baihongyu.com/