动心了,那在开完了这么一个会之后,贾鸿渐私下里就调查了一下那什么nuance公司。结果发现这nuance公司在这么一个年头呢,也不算是发展的多么大的一个公司,只能算是一个中小型公司。他们很早就开始研究语音识别软件以及图像处理软件等等东西,特别像是语音识别软件,那是在电脑上做的一个人对麦克风说话,软件可以识别出来人说了什么的这么一个东东。表面上听起来非常的高大上,但是问题在于本来就是科技弄潮儿的贾鸿渐知道,这玩意儿其实并不太靠谱,距离真正的突破远得很呢!
虽然这nuance公司在iphone4s一系列的相关宣传中,被人说是世界上最大的研究语音识别的公司。但是问题在于贾鸿渐知道历史上ibm也研究过这东西,而ibm也是有语音识别软件的!历史上到了2010年左右,那ibm的语音识别软件做下来的结果,那识别率也并没有达到近乎完美,基本上最多就是90%这样!而且说的越快错的越多!这是贾鸿渐自己用了ibm语音识别软件之后的感受,而且这感受还是伴随着按照ibm语音识别软件上面的提醒,把各种软件列出来的短句什么的念了好多遍,让ibm软件熟悉他的口音的结果!
所以从这么一个角度来看的话,这nuance公司,也没有牛逼到哪里去嘛!号称是什么全球第一第一的。可是实际上离他们的产品真的热销全球那还早得很呢!他们的产品也离完美早得很呢!只不过最多能算是跟ibm的语音识别软件一样处于一个“能用”的状态而已。在这么一个情况下,这公司能够提供给华夏高科的是什么?最多也就是一个做语音识别的经验,最多也就是一系列的数据库而已!有这么一个数据库,可以说也许整体可以帮华夏高科两年之内就推出可用的产品,但是华夏高科真的自己就做的话,也许三四年也就能做出来七七八八的产品了——毕竟siri这么一个东西,那并不是一个专门用于语音识别的软件啊,这是一个类似人工智能的东东,或者说退后一步就是一个语音管家!这么一个语音管家能不能一次就分辨出来使用者说了什么,这其实并不重要!重要的是能用。而且识别率有个**成。这就够了!
这么一个语音管家,并不需要跟速录员一样百分百的准确,并不需要第一时间快速的就理解使用者在说什么。这管家在没听对的情况下,完全可以经由使用者进行纠正。就像是听到了同音词或者近音词一样。这么一个siri。不需要像是ibm或者nuance的语音识别软件一样。能够配合上下语义来进行区别近声词同音词,只要差不多就行了,剩下的完全可以进行使用者本身的人工来纠正。毕竟这么一个人工管家。玩儿的就是一个人机交互给使用者的一个新鲜的感受,卖的是新鲜,而不是准确!
这siri不需要帮着使用者来码字写文章,所以就不需要百分百的准确,siri也不需要变成语音的键盘,不需要代替实体键盘的作用,所以也当然不用百分百准确。而且普通消费者毕竟只是普通消费者,他们不是专业人士,他们也用不到那么专业那么严谨的功能,只要东西差不多,哪怕不完美,但是能够给他们接触一下业界新科技,让他们感受一下像是科幻世界里面的那种科技产品,这本身就已经够让他们开心的了!就像是傻瓜相机一样,傻瓜相机这东西从来就不如单反相机来的专业。
以前的胶片时代就不说了,在数码时代这么一个单反和傻瓜卡片机之间的差别更大——双方的cmos或d的尺寸就不一样,像是单反相机那就有全画幅的cmosd,这样一来就有类似35毫米胶片的那种底,在画面清晰度上面绝对没得说!外加上各种可更换镜头,那景深以及广角方面以及焦距方面简直比卡片机好太多了,而卡片机的数码变焦那实际上还会损害画质!所以说要拍出来真的好看的照片,最好还是要用单反这种相对专业的相机,而且最好还是全画幅的。可是世界上卖的最多的还是各种卡片机,还是各种傻瓜相机啊!为什么会这样?因为普通消费者并没有那种专业的需求,人家不需要把照片拍的很好看,人家只需要留个影就行了!
人家不需要单反上面各种全手动操作带来的那么一种全部自由的操作方法,人家需要傻瓜的不用了解太多直接就可以拍的这么一个功能!哪怕画质差,哪怕焦距差,哪怕一切都差,只要便携那就够了,只要让老百姓能够随时随地出去玩儿的时候给家人朋友拍照,这就够了,人家不需要多专业的功能!同样,谁说老百姓就需要完全专业的语音识别功能了?差不多够用这就行了!这跟工业化大生产一样,老百姓需要的工业用品,从来就不是什么精致的工艺品,就像是手表,老百姓用来计时顺便装点一下形象,那就够用了,不需要什么全手工制作的瑞士工艺品级别的高档手表,大工业生产线上出来的手表就够用了!
所以在这么一个时代,贾鸿渐判定做这么一个所谓的人工智能语音识别软件,只用华夏高科一家努力就行了。这么一个公司收购那也是浪费钱——君不见历史上的苹果也只是收购了siri,而没有收购什么nuanc
>>>点击查看《风骚重生传》最新章节