科技大崛起
字体: 16 + -

第十三章 智能语音识别

    东湖技术园区,一家看起来有些高档的餐厅,出现了一个不太搭调的一幕。

    主要原因是罗辑的吃相。

    其实罗辑吃东西的样子也并不怎么难看,只是再和餐厅中的其他人进行对比,就显得有些乡巴佬了。

    至于和罗辑对面的宁熙言,那更是没有可比性。宁熙言皓腕拿着汤匙在杯中缓缓搅动,整个过程都不会撞一下杯壁,气质优雅浑若天成。

    两人从公司出来后,便在宁熙言的带领下来到了这家餐厅。在解决完事情之后,已经是下午五点了,正是饭点时候,餐厅里人也多了起来。那些来这吃饭的人大多数都是白领,更有不少是精英。

    他们一般会选择边吃饭边谈工,没有食不言的忌讳,毕竟都是慢条斯理的吃法怎么都行,可偏偏现在出了个奇葩。

    “要不要再来一份?”宁熙言巧笑的看着罗辑将盘中的食物吞下肚中,轻声问道。

    罗辑有些不太好意思,要怪只能怪这些套餐分量太少了,那么大的盘才装一点点糊弄谁呢?不过在摸了摸丝毫不减鼓起的肚子之后,罗辑还是点了点头,反正这顿不是他请。

    罗辑不仅吃的多而且快,他感觉最近的食量越来越大了,每次在停下思考之后都会感到很饿。罗辑吃的快也是有原因的,他时间很紧争取将精力都放在研究上。更何况现在还有了一台服务器。

    “你知不知道你现在成了关注的焦点?”

    “焦点?”罗辑将餐具放下,瞄了一眼四周,他又不瞎怎么可能看不到“怎么?难不成这餐厅对吃法还有讲究?那真是太差劲了!我认为服务一定要自由,怎么还能约束消费者?宁总,我们公司可不能学这样!”

    罗辑认为未来生活必定是自定义的,是开放的。用户可以在任何时间任意地点,控制他想要控制的东西。

    “我说的不是这个!”宁熙言可没管周围人的目光。这家餐厅也仅仅称为高档了,对于宁熙言而言就像包子铺之于普通人罢了。

    “那是什么?”

    “网上!”宁熙言将自己的手机拿了出来,调出一个网页然后递给罗辑。

    罗辑将信将疑的接过手机,不看不知道一看吓一跳,这哪里是什么焦点,都快被人人、肉干净了。在哪读书什么专业,老家何处家中排行第几,写的一印俱全,甚至连小学得了什么将都有人知道。

    “这……这怎么回事?”罗辑大脑先了空了一会,在短暂的恼怒之后很快就平静了下来。

    “实验室的事,被人发到网上去了。你应该可以想象三千万美元出现在一个大学生身上后,其吸引话题的能力……”宁熙言顿了顿“还有吸引人的能力,而那些资料……我查了一下,是你以前的同学曝光出来的,大学、中学还有小学。”

    这让罗辑有些愕然了,小学同学都有?

    “幸好你朋友不多,曝出来的资料很少,要不然出了什么丑闻就不好办了。”这个时候宁熙言还有心思开玩笑。

    但是罗辑却听出了幸灾乐祸的味道,什么叫幸好朋友不多?那后面的丑闻也不能装没听到啊!罗辑颇为无奈的叹了口气,大互联网时代不存在**可言。

    “这或许是个机会!”宁熙言抿了一口茶水“一个炒的机会,这可是免费的广告。”

    “用我来做宣传?”罗辑惊了一下,有些没反应过来。

    “主角是你,还有个配角唐杰。”

    “他?三千万买技术的事?”

    宁熙言微微一笑解释道“还有他与其他公司解约,投入到另一家公司的事,以及……”

    “算了你不用和我说了,头疼。”罗辑苦着脸打断了宁熙言的话,这些在他看来最为繁琐不过了。

    宁熙言笑着摇了摇头,对于罗辑的性格她是越来越清楚了。

    “那么敬爱的董事长,等会准备去哪呢?”宁熙言说话的时候,头却转向了写字楼。

    “当然是去公司!”

    罗辑说的义正言辞!

    ……

    在挥手告别送自己来公司的宁熙言之后,罗辑就无法按捺心中的激动了。

    刀片式服务器啊!这意味着桎梏小音发展的硬件需求消失了,至少在未来的一段时间内不用担心。

    关于服务器的使用与组装,罗辑以前就有了解,即使再有什么不懂的地方,在科技树中也能找到相应的知识。

    在一番调整之后,服务器正式进入了工阶段。听着机箱内强力风扇运转的声音,罗辑感觉这是世界上最美的声音……不对,仅次于脑海中的那个声音!

    将小音的核心代码转移到服务器之后,罗辑的手指便在键盘上不停的敲打了起来,一行行代码快速的写入核心之中,扩充着小音的智能。

    这些知识自然也是来源于科技树,可以这么说即使有程序员站在后面,看罗辑的这些代码也不是他们能够看懂的,这不仅仅是算法语言上的差距,更是一种不同于以往的电脑逻辑。

    再敲下最后一个回车之后,罗辑长出了口气。刚才用老大的心思编写的代码,是语音识别。与传统的语音识别相似的是,它依然是将声音矩阵转换为文本,将每一帧识别成状态,再将状态组合成音素,最后再把音素组合成词语。

    不同的是,它不完全依靠于“声学模型”,更不需要构建状态网络,因为它具有一定的自我学习和推理能力,近似的元素完全可以自行解决。

    “应该叫智能语音识别!”

    罗辑一遍检查着代码,一遍喃喃自语。现在市面上的语音系统,更多是依赖网络,因为人在发音的时候往往会存在口音不正、吐字不清的问题,要分析用户说的话必须建立在大数据的前提下,必须录入了足够多的音源。

    这种模式不仅低端,而且效率低下,体感也不行。而罗辑编写出来的这套,只需要一套最基本的音源,在差别率小于百分之五十的情况下,识别率更高达百分之九十五!

    “95%?”罗辑自己都有些不信,因为这些数据都是科技树上所记录的,在没有做出实物之前,的确让人怀疑。

    没有九十五,也就九十吧?罗辑有这个信心。

    实践永远是最好的答案。想到这里,罗辑便让小音自行在网上收集语音库,短时间将所有的语音收集完肯定是不现实的,但是可以先弄一些常用语。

    罗辑决定在常用音源下载完毕之后,立刻着手语音录入功能,他可不想每次下指令还要输入文本,那显的多low啊?这就是罗辑的思维,一个智能核心他还觉得低端,甚至语音都只是起步!

    不得不说,懒是人类进步的阶梯。

    在小音提示搜索完毕之后,罗辑就开始了下一步工,导入音源。听着这些字正腔圆的播报音,罗辑有些感叹,小音的智能程度越来越高了,她都是在正规且专业化的网站收集的,并且还会进行筛选。

    在转移到了服务器之后,罗辑再次让小音开始了学习,这次的语音收集不过是个检验。

    分解音源,罗辑从中提取了很多音素和状态,剩下的工就是小音的事了。人工录入是一个繁琐的过程,这绝不是罗辑一个人能够完成的工,好在有了小音。

    工起来的罗辑是忘记时间的,有了服务器的强大计算能力支持,罗辑感觉自己的事根本做不完。

    趁着小音还在处理数据的时候,罗辑便开始准备文本转换为语音的工,未雨绸缪早晚都要用到。