• 当前位置:首页  >  综合  > 不雅直播视频秀|智能语音行业应用的机会和疑惑,看这篇近万字文就解了
综合

不雅直播视频秀|智能语音行业应用的机会和疑惑,看这篇近万字文就解了

时间:2020-01-11 17:56:53  查看:2007
内容摘要:-搜狗在智能语音行业应用成功案例。智能语音这两年成为了一个热点产业,吸引了国内外广大公司以及投资者的关注。在siri之前也会有一些语音交互的研究以及产品,但是都是单纯的基于命令菜单式的,这都不能算是智能语音。预计2016年语音产业规模可达82.3亿美元以上,到2017年,全球智能语音产业规模将达112.4亿美元,复合年均增长率达35.1%。

不雅直播视频秀|智能语音行业应用的机会和疑惑,看这篇近万字文就解了

不雅直播视频秀,智东西创课前言

这是智东西创课第24期课程实录,分为主讲+问答二部分。主讲嘉宾是王砚峰,搜狗公司桌面事业部高级总监,桌面研究部和语音交互技术中心负责人。读完近万字全文,你可以掌握到:

-智能语音的定义以及市场有多大?

-智能语音在车内,客厅内,以及可穿戴三个场景会快速规模化应用,但如何做呢?

-智能语音的行业应用的爆发取决于哪三个因素?

-为何语音交互没有在智能手机上快速普及?

-为什么聊天机器人不停地被大家遗弃?

-如何看待亚马逊echo、google home的切入点以及前景呢?

-mor、三角兽等自然语义处理引擎初创公司的前景几何?

-基于语音识别的智能客服产品如何市场化?

-三五年后语音识别市场会形成什么格局?

-搜狗在智能语音行业应用成功案例。

主讲环节实录

大家好,我08年进入互联网行业,之前在搜狗负责输入法后端的研发,然后又支持了多个搜狗号码通,手机助手,浏览器等用户产品,所以我是一个彻头彻尾的互联网从业者,今天会站在互联网公司的角度谈谈我的观点。从2012年开始,搜狗开始做自己的语音识别引擎。智能语音这两年成为了一个热点产业,吸引了国内外广大公司以及投资者的关注。同时这方面吸引眼球的新产品层出不穷,巨头们也在不停地布局。因此今天我不讲具体的技术或者产品,而是站在产业以及市场的角度给大家做一些不成体系的分享。为了具有一些针对性,我拜托智东西的同事们收集了一些大家普遍关注的问题,针对这些问题做一些具体的解读,把我个人包括搜狗公司的观点带进去。希望大家可以从我的片言只句中,看到我们背后的思考以及逻辑,甚至是技术观产品观和价值观,给大家带来一点点的启发。

所谓智能语音其实就是给语音加了大脑,能够理解用户通过语音表达出来的意图和需求,并且可以把对应的内容返回给用户。所以已经不仅仅是语音本身的范畴了,而是结合了自然语音理解,搜索等多种技术,最后通过语音的形式表达出来。一个典型的例子就是siri的语音助手。在这里面强调的是一种自然交互的方式,越自然越智能。在siri之前也会有一些语音交互的研究以及产品,但是都是单纯的基于命令菜单式的,这都不能算是智能语音。

语音市场的规模,引用一下工信部以及语音产业联盟的数据。自己没有做过太多细节的考证,贴出来给大家参考一下。根据中国工业和信息化部电子科技信息情报研究所数据显示,2013年,全球智能语音产业规模整体达33.7亿美元,同比增长38.1%;2014年较2013年同比增长41.0%;2015年较2014年同比增长35.7%。预计2016年语音产业规模可达82.3亿美元以上,到2017年,全球智能语音产业规模将达112.4亿美元,复合年均增长率达35.1%。

智能语音作为入口这件事情实际上已经发生了,比如在目前车内的后装导航,出货有很大一部分比例都是智能导航,通过语音来进行交互。尽管用户体验以及效果还存在一些问题,但是已经具有一定的可用程度了。

但是什么时候能爆发,还是要取决于:

第一,车联网以及智能家居等产业的进一步成熟,能给用户带来真正的价值,让用户在这些产品上产生切实的消费,而不是玩一下就扔。这样产业和产品的需求就会进一步倒逼技术的进步。

第二,语音的鲁棒性的问题需要进一步的解决,比如远场,噪声,多说话人等问题。当然这个过程是一个渐进式的。

第三,自然语言的理解能力也要有更大的提升,机器更加懂得用户的意图,才能给用户带来更加稳定的体验,产品才真正的可用。

所以爆发不仅仅简单是技术层面的事情,而是从产品设计到技术能力,都要比现在有一个更好的提升。

语音交互目前在手机端比起文字交互来讲,确实算不上普及。比如目前每天会使用语音输入的用户占到8-10%左右,这仅仅是uv比例,如果是pv比例那就更低。另外从前阵子老罗在锤子发布会上给讯飞做了一把宣传以后,当时讯飞语音输入着实火了一阵,这也说一般用户对于语音功能的认知是远远不够的。惊奇于当前语音输入能有这么流畅的效果,说明大家的印象还是停留在久远的过去。那手机上目前认知度和普及程度还不够的原因主要都有什么呢?

从技术上讲,语音在开放场景下还不够准。比如方言的问题,噪声的问题,尤其是其他说话人带来的噪声目前仍然是致命的。所以语音对于用户来讲,识别结果不是完全可以预期。一旦错了修改的成本还是很高的,所以很多用户宁可打字。因为文字输入的结果是稳定的可预期的,这种可预期本身就会带给用户安全感。因此绝大部分用户是为稳定而买单,只有一部分用户会为酷炫和高效买单。但是大家也看到这个趋势,就是用户在手机上使用语音的比例在不断提升,这也是技术不断提升的一个结果。当然从另外一个角度,当前手机上的语音主要还是聚焦在输入法,以及语音搜索上。设想一下用户在搜索场景下,如果他这个时候方便打字,只需要在地图app上打一个地名,效率本身也并不定(地图app往往都有suggestion的能力),这样用户也不会冒着语音错误的风险去用语音的输入。换言之就是大部分用户的输入量都不够大,键盘也已经用的很纯熟,搜狗输入法的键盘还具有智能纠错功能,这就使得大部分用户对于输入效率的痛点不够,也没有进一步的动力去冒风险尝试更有效率的输入方式。实际上从当前用户反馈中,愿意使用语音的用户,尤其是重度用户,都是以文字工作者为主,包括我们的记者朋友们。他们就是愿意为了效率去冒一些不确定性的风险,但是从效率上的收益是巨大的,足够形成动力的。因此最终目前手机上语音输入的场景分成两类:一种是用户当前确实不方便打字,会选择使用语音。另一方面我们看到年轻人会更加喜欢用语音的方式进行输入,觉得这种行为更具有style,更好玩儿。重度文字工作者在所有用户中更是只占一小部分比例。

哪些语音交互场景最具增长潜力,以及能快速规模化应用?三个有价值的场景,目前大家已经很有共识了。那就是车内,客厅内,以及可穿戴。引用一下今年互联网女皇在她报告中提到的,美国同学们使用语音的主要原因和场景:

不过这几个场景爆发的顺序有先后。我认为是先是车,然后是智能家居,然后是可穿戴。车的场景最明确,需求也最明确,产品定位也最明确,所以语音的目标也最明确,从产业步伐上来看,目前车内导航语音普及率也是最高的。智能家居目前围绕电视和音响,具体的需求就是搜片和听歌(以及fm等),加上echo的带动,这方面的需求也比较明确。但是目前有些过热,比如一个以听歌为主要产品场景的音箱,已经被大家定位成了未来家庭智能的入口。可目前产品本身做得不够好,所以其实用户消费还是比较惨淡。不过长期的价值我是看好的,只要大家产品观正确,先打造一个好产品,再考虑入口的事情,最终还是能够有一个更高的普及率。可穿戴我认为是最晚的,因为市场上产品还没有成为刚需,比如智能手表,给用户带来的价值,其实是远小于我们内心中的预期的。语音的价值更不可能在产品就产生价值之前呈现出来。

说下聊天机器人。因为我们的谈的是“智能语音”。智能这个概念,最好的体现就是让设备像人一样具有感情,越具有感情越觉得智能。也是因为这个认知,把大家导向到了这样一条不归路上。瓶颈目前其实很明显,那就是技术问题目前导致机器本质上来讲没法达到人的地步,一个心智上没有问题的成年人,一定不会长期使用的,可能就是最开始用着新鲜体验一下。给一张我在外面常用的图来解释一下:

这是我认为一个好产品所具备的最基本要素。我们回到机器人这个产品上。当前的聊天机器人只是解决的产品金字塔最顶层的“有趣”的要素,但是更底层的“刚需”以及中间层的“稳定”都远远不足。这也是为什么聊天机器人不停地被大家遗弃的原因。为了不被人遗弃,我们的小冰mm只好每两周都升级一个新技能,让大家持续保持新鲜感。否则很容易7日之痒。

但是从产品价值本身来讲,其实小冰还是没有给用户带来真正的价值的。所以如果不继续升级来刺激大家,很容易就被抛弃。聊天机器人未来的突破口可以放在儿童方面,因为儿童的心智本身就是非理性以及跳跃的,并且重复的东西儿童也会喜欢,所以儿童是可以持续和机器人去玩儿。能结合聊天机器人做一个好的玩具,那对于儿童来讲还是具有不错的用户价值。

该如何看待亚马逊echo、google home的切入点以及前景呢?把语音智能硬件作为一切服务的入口,是大公司的一种面向未来的选择。因为对于谷歌和亚马逊这样的巨头,只是定位成一个音箱产品,那确实太小,也没有太多战略价值。但是从今年亚马逊echo的销量来讲,目前得到的信息是已经要卖不动了。而且这样酷的产品,在美国市场只是卖了几百万的量,还是不够大。google home的销量更是不用提。原因其实也很简单,就是我之前反复强调的,产品价值没有那么大。而且当前从产品到产业都不够成熟,用户在上面很难形成具有商业价值的消费闭环,所以入口这个事情是现在根本做不到的。但是未来这种形态一定是有价值的,区别只是放在音箱或者电视或者手机上的差别。但是这条路会很长,需要长期坚持下去。对于巨头和大公司我觉得是可以这样做的。

最后谈谈搜狗在智能语音的应用上的布局。搜狗的主要产品是输入法+搜索引擎。面向未来的人工智能而言,搜狗的核心战略就是:自然交互+知识计算。自然交互完成人和机器之间的环节,知识计算完成机器和信息之间的环节。其中智能语音其实就是这一技术路线的入口,主要完成的是自然交互的部分。所以可以看到,智能语音是搜狗当前发展战略上的核心能力之一。所以一方面我们会不断地投入更大的研发力量,让我们在语音交互方面的能力具有技术上的制高点,另一方面我们也看重能力的在产品中的使用和落地,让我们的技术尽可能的给用户带来更多的价值。目前在用户产品上,我们的语音输入每天用户使用次数已经到达了1.8个亿,是互联网上最大的语音输入产品(当然这一点得益于搜狗输入法在移动互联网上的垄断的市场份额)。语音搜索目前也是仅次于百度处于第二的位置。同时在今年7月份我们发布了“知音语音引擎”,旨在和产业界中优秀的的产品和合作伙伴共同打造更好的语音交互产品。在车载方面我们和自己的地图合作,推出了车机版全语音交互的导航;同时我们和四维图新强强联合,能力互补,一起把我们的语音方案推到车载设备中,这一方案已经在一些顶级导航设备厂商(比如飞歌)的产品中上线。客厅场景中,我们已经跟魅族合作并在其盒子产品中上线了语音搜索功能,在谈的还有一些优秀的电视以及互联网硬件产品公司,由于产品还没有发布出来我暂时这里不提名字,大家应该可以在年内以及明年初看到我们与其他巨头公司更多的合作产品出来。

问答环节实录

提问1

陈楷煌 广东工业大学 工业设计专业

想问下现在语言交互方面,ai对于对话环境的识别做到了什么程度? 比如当我们晚上睡觉前和它对话时,它会不会就温柔一点,声音轻一点?而在开家庭聚会时它会不会就欢快一些,声音大一些(如果聚会时环境比较嘈杂)?

王砚峰:目前的产品设计这块普遍是没有包含这个逻辑的。就像我之前说的,其实当前这方面的产品还没有解决好实用性的问题,因此更高层次的人性化更是无从谈起。

另外,机器能知道的信息主要是环境是否安静,以及时间。但是光有这两个维度的信息是不足以判断周围环境适合用什么音高的。人是怎么判断的呢,可能是靠眼睛看周围的环境,也可能是靠对方一个动作“嘘”。

机器的视觉和感知能力还远远达不到这个水平。所以即使做出来,也是很生硬的规则,你会发现放到真实环境中效果也会很一般。

提问2

徐凯 百度云计算事业部 高级产品经理

想了解一下基于语音识别的智能客服产品是否可以市场化?

王砚峰:完全可以市场化。从需求来讲,目前客服是各大产品的必备功能,而且每个大公司都投入很大的人力物力和坐席成本。所以各个公司确实也都在积极向语音服务商寻求这方面的好的解决方案。

从技术上来讲,因为客服的问题都是聚焦在产品或者某一个垂直领域的,而不是一个通用机器人,所以目前自然语言理解能力,辅以整理的较好的知识库,是可以能够对较高比例的用户问题提供答案的,剩下解决不了的再通过人工的方式来close掉。

提问3

李祺 先锋车联网 技术leader

语音语义识别如何利用到智能汽车的场景中?

王砚峰:最直观的就是车内的智能导航,以及一些周围查询和用车问题。目前不管是主机厂还是后装设备厂商,大家都在不遗余力的往这个方向去奔。因为你在车内双手和双眼就是被占用的,当你有临时性需求的时候,语音是一种最好的满足方式。

当然,从产业端来讲,大家希望最后在车内实现服务化,做好整个“车联网”,希望语音最终能够和服务结合起来,把商业上的闭环跑通。但是目前不管是语音交互的能力,还是服务落地能力,距离最终目标尚有差距。举例子就是用户很难通过车内的语音交互去定附近的酒店,这个需求既不高频,同时解决方案也不如直接把车停下来查携程好。

所以我们会更务实一些,第一个目标是在导航,以及用户在路上产生的常见问题比如顺便加油、听fm,回微信消息等做到良好稳定的用户体验,把这方面的用户价值做起来,然后再去考虑服务延伸的事情。

提问4

毛杨 华为 业务规划

良好的智能语音体验,对网络是否有要求?

王砚峰:当然对网络有要求。除非像导航这种特殊的需求。其实导航上对于离线语音的需求,也是因为存量市场很多导航都是离线的,以及一些偏远公路网络信号差,所以不得不使用离线的语音。但是从识别的品质来看,在线的识别能力一定会比离线的强很多,计算力的差距摆在那里。更好的识别能力,就能够带来更好的语义理解以及内容返回。而且所谓智能语音,绝大部分后面要接一个搜索,可能是垂直的搜索,也可能是通用搜索。如果没有网络,搜索和服务的能力也不能接入,那又何谈智能。

提问5

王楠 中科创达 战略投资经理

搜狗目前在智能语音领域,是否有比较成功的行业应用可以分享,比如语言教育、汽车、智能设备等。谢谢。

王砚峰:搜狗是互联网公司,因此目前太重的行业(内容上的重或者商务上的重)我们还没有涉足,比如教育。但是只要是面向用户消费类的产品,哪怕最一开始模式是2b的,我们也会涉足,因为实际上这是一个b2b2c的模式,最终使用你能力的还是互联网用户本身。比如车内导航以及智能电视等。

至于成功的行业应用,如果是以用户量为判断标准,至少我们当前还不敢这么讲。我们目前暂时不以铺量作为业务目标,而是希望能够找每个领域的少数优秀的合作伙伴,共同去做出体验更好的产品。先解决目前市场上问题最大的“产品体验”的环节,然后再考虑如何去复制。既然这个市场大家用户体验都不好,而且大家都对好的用户体验的产品很敏感,所以只看量不看体验完全是本末倒置,到时候抢来的量也会流失掉。

所以目前在车上,我们和四维联合做了飞歌导航的一款产品,后面也会有几款后视镜以及车机导航产品面世;在智能电视方面,我们和魅族联合在魅族盒子上做了语音交互和搜片,另外也有几家好的合作伙伴处于产品即将上线状态。

然后我们的重点会放在通过对用户消费数据的迭代,不停地提升我们语音和语义能力,让产品的体验更好。当我们的产品体验能够形成行业口碑的时候,快速的铺量自然不会是问题。当然,作为新加入智能语音行业2b市场的我们来说,能有各行业巨头优秀合作伙伴进行深度紧密的合作,赢得这些我们尊敬的公司的认可,已经是一种“成功”。[愉快]

当然我们要走的路还很长,用户在语音产品上的体验还太差,所以我们和伙伴们一起推动产品的进步。

提问6

安迪 深圳新驱动力有限公司 项目工程师

科大讯飞的语音输入宣称准确率达97%,应用到智能机器人等设备,需要怎么做,才能达到理想的智能对话?

王砚峰:首先解释一下97%的问题。搜狗对外也宣称97%,这个数字实际上是人工评测得到的数据,确实我们和讯飞都是在97%这个数字上面。但是放到更真实复杂的环境,比如远场、方言、多个说话人等问题,准确率就会打折扣。所以语音识别的鲁棒性问题,还是一个从技术上需要进一步长期投入需要持续解决的一个问题。

你拿一个语音输入法,用非常自然的方式和他说话,或者在一个很嘈杂的环境中,一定是达不到97%的。所以要达到理想的对话,一方面像我之前提到的技术制高点,是需要不断去努力让技术更加得到本质性的改进的。这个技术包括语音增强、阵列以及说话人分离等多个领域,目前确实也是研究界的大热,以及工业界新的增长点。另一方面,可能要从产品设计上进行优化,在承认语音识别有错误的情况下,怎么能够通过进一步的交互来让语音识别变得更准。比如搜狗在今年上半年推出的语音修改功能。实际上这个功能对于车内、音箱上甚至“机器人”都是非常实用的。

提问7

张青涛 大疆创新 工程师

智能语音处理对硬件平台有什么要求?例如延迟、精度、实时性。

王砚峰:这几个指标其实最终统一到一个描述,就是“计算力”。在当前深度学习的背景下,网络结构的复杂和参数的增加带来的就是精度的提升和实时性的下降。想要解决这个问题,只能是计算能力更强的硬件。

具体而言就是cpu已经不够了,你要用高性能gpu或者fpga作为线上服务器的计算模块。而如果是离线端,想要保证达到和在线接近的效果,也只能是利用嵌入式gpu以及fpga的方式去做。这方面随着模型复杂度的提升,专用芯片可能是个趋势。比如在线服务下并发量很高的情况下,可以用并行化的算法跑在gpu上面。但是离线端都是本地处理,谈不上高并发,所以可能fpga就会更经济更合适。当然,具体情况具体讨论了,没有一个完全统一的准则。

提问8

黄力 博汇科技 bd

目前哪种框架开发的算法,在语音识别上实时性最好?比如tensorfollow或caffe 等,哪个更适合语音实时性的算法开发?

王砚峰:目前开源软件普遍重训练,这部分对实时性要求不高,实时性更多体现在解码或者inference上,这部分想实用化还需深度优化,而且解码的过程也一定要结合识别本身的任务还有计算平台来深度定制,实时性(时间复杂度)和模型复杂度要做综合考虑,目前我们团队快速训练小规模数据时会考虑tensorflow,inference阶段我们是自己开发的解码器,但是tensorflow的inference在跨平台上的工作还是很不错,适合快速验证能力模型。但是一旦到了训练几万小时的线上模型的时候,并行训练平台也都是我们自己的,也并不采用tensorflow。

提问9

韩云飞 e道伴侣 语音交互设计师

1、抛开语音技术程度,语音目前的智能程度大概在几岁,在国内未来会有哪些行业

2、我觉得语音是趋势,但也只局限在某些行业,哪些行业将受益,我们这些技术、交互能坐在哪个位置?

王砚峰:我想你提的问题是抛开语音识别准确程度,如果只看文本,智能程度大概在几岁。负责任的回答,这个没有可比性。你问一个十岁的小孩知不知道天为什么是蓝色的,可能他完全不知道。但是对于一个一岁的小孩儿,你教他衣服上的一个商标,他以后看到的衣服或者鞋子上的商标他都可以指出来,但是机器不行。所以机器智能和人工智能,一个是靠大数据去堆,一个是靠抽象和推理能力,是根本不同的两条路。

至于行业问题,我在之前的分享中已经多次提到了。车载、智能家居和可穿戴。坐在什么位置,取决于你在产品中带来的价值。比如对于车载导航,那就是非常关键的位置,是入口,在你手和眼睛被占用的时候,就是你的唯一解决方案。但如果是抽油烟机,语音只负责控制开启和停止,那价值就很小,我随便一抬手就可以替代掉,而且我既不会在客厅里面喊抽油烟机让它开关,也不会无聊到让抽油烟机跟我唱歌或者说话。所以本质上抽油烟机是不需要对话上的智能性的,所以语音在其中的价值最大程度上也只能是噱头,只能利用市场的不理性时机打一个时间差。

提问10

于小利 缤特力 声学工程师

相对于其他语音服务,搜狗语音服务有哪些优势和劣势?

王砚峰:搜狗语音服务的优势主要有三个:

第一借助于搜狗输入法垄断的市场地位,我们每天能收集到的用户真实语音数据有十几万小时,里面包含了各种用户真实场景下的噪音,口音等,这帮助我们极大的优化了我们的鲁棒性,因此我们的语音在真实环境下表现非常出色;

第二我们背后有搜索服务的支持,这也是早年间我们为什么能快速推出语音助手的原因。我们拥有各个垂直搜索以及对应的知识图谱,这对我们语义理解和对话的帮助极大。

第三我们有丰富的产品经验,会想办法通过产品设计,对话的设计来提升语音交互的体验,就像之前给大家看到的语音修改。这里我再举一个智能导航的例子,如果我们更清楚的了解用户在导航时候的习惯以及问路的方式,就有机会让导航的交互体验更好。

大家可以看到,“我要去紫竹桥那个”这样的描述方式,是当前市面上任何语音导航方案都不具备的。这也得益于数据层面的打通,以及用户行为更好的产品理解。

提问11

于乾隆 爱尔眼科 知识管理经理

智能语音是否可以成熟到可用于电话客服?如果不够成熟主要有哪些待突破的障碍?

王砚峰:目前已经有一些应用,但是还是不够成熟,只是刚刚开始。一方面语音识别的效果需要更准,电话信道语音质量较差,另外用户说话的方式会更加随意,而不是像对着机器这样去讲,因此识别的效果都会打折扣。另一方面用户的复杂查询理解上机器还做不到,机器可以做到的就是来一个知识库中能够匹配的用户问题,然后给答案。但是替代人工客服解决用户多轮来回复杂交谈的问题,还处于非常弱的阶段,这块需要智能对话技术的进一步突破。

提问12

杨晰 乐视网智能生活事业部 产品经理

1、老师你好,我是做智能家居平台的产品,有两个问题想听听您的看法,目前市场普通家电转型智能家电,目标应该落在大众普及还是高端极客更得以教育推广?

2、语音交互是否像界面交互一样,需要傻瓜式引导?

3、当事实语音交互时,除了数据通讯加密,信息安全是否也需要杀毒?

王砚峰:任何新的产品,都是先有一些喜欢接受新事物的用户来体验。这部分的用户的容忍度比较高,可以忍受产品的不完善。如果你的产品体验最终不能满足大众傻瓜的需求,那也只能停留在极客层面。但如果产品体验足够流畅到大众能接受的时候,那么就会普及。我觉得普及是我们的价值追求。当然如果想追求情怀,那是个人选择问题。但是把技术带给更多的大众使用,提升大家生活品质,我觉得才是最有价值的。

语音交互界面设计一直有一个术语叫 vui,就是讲述怎么来设计语音交互的界面,这是一门科学。有兴趣的的话可以在网上搜一下看看,病毒方面,我觉得目前是不需要的考虑的。因为病毒能够流行起来因为pc和手机都是应用程序的平台,病毒的存在方式exe和app,病毒就是程序。当前语音分发的是内容,不是程序。所以暂时不需要为这些问题担心

提问13

刘雄 中金 研究员

现在科大讯飞在中文语音识别领域具有很突出的技术优势。同时,我们看到,国内外的互联网巨头和创业公司都在技术上加大力度研发,有不错的成绩,您怎么看三五年后语音识别市场的格局?

王砚峰:语音识别市场的格局,我没法给出一个很确切的结论。但是有一点很明确的,那就是一项技术,如果要在市场和商业上产生价值,要么就是技术被垄断,要么就是你的技术比其他家有一个质的差距。

但实际上目前不管是科大讯飞还是其他大的互联网公司,大家的技术基本没什么质的差别,所以你很难从单纯的技术上建立成熟可靠的商业模式。所以要么你就往上游去走,和搜索引擎结合起来,语音和内容服务结合起来,要么你就往下游走,和硬件产品结合起来。如果只看语音技术本身,那是不足以产生竞争力的。在未来和互联网巨头的竞争中也会很被动。

当然纯粹的2b生意,比如教育医疗等行业的应用,需要和行业进行高度定制,这个是互联网公司不愿意轻易迈入的,所以单纯的语音服务在这些行业还是有长久的价值。但是一旦到了b2b2c模式下,就很难讲。

讯飞是我们非常尊敬的技术创新的公司,这里也没有任何观点的偏向性在里面,只是从技术普遍发展规律下的一个看法。

提问14

陈彩可 乐视车联网 产品经理

请帮问一下王总,如何看待自然语义处理引擎创业公司比如mor、三角兽,以及搜狗引擎和他们是否有合作。

王砚峰:搜狗和这些公司没有合作。目前自然语言处理引擎创业公司有两条路,一条路是做助手、做机器人的2c产品,但是我认为这方面不管是技术,还是产品和产业本身都不成熟,不适合创业公司来做。

另一条路是帮助其他公司提供能力,做一些2b的服务。这个能从阶段上弥补产业界各个环节上的薄弱,就像最早很多互联网公司也会使用语音公司的引擎一样。但是长久来看,从趋势上来讲,越大越成功的产品,越能给这些2b公司带来价值的产品,都越有走向平台性通用性的倾向,一旦定位成了平台,那就离不开搜索的资源支持了。

当然搜狗是站在一个开放的心态上欢迎各方面的合作的,但是语义能力其实也是搜索引擎未来发展的核心能力,既存在于自然交互,也存在于知识计算,所以这方面的能力也是搜狗必须去做好的。当然因为有搜索的存在,我们忽悠一个更好的基础。


© Copyright 2018-2019 gnoor.com 沙腔门户网站 Inc. All Rights Reserved.