消息 在人工智能、5G算力网络、数智化生产力等新技术发展的推动下,AI+5G算力网络让人们对于智慧家庭的美好生活向往触手可及。11月2日,科大讯飞董事长刘庆峰在中国移动全球合作伙伴大会作了主题演讲,分享了科大讯飞人工智能最新的一些进展以及在智慧家庭领域的工作和下一步设想。
人工智能面临两个时代的主题
“目前,人工智能无论是产业界还是科技界共同面临着两个时代的主题,一是人工智能3.0的红利如何快速兑现,如何迅速地改变当前社会的生产和生活方式,二是面向未来新一代人工智能的发展还需要做哪些最前瞻的工作。”刘庆峰坦言,科大迅飞从创业第一天开始就提出让机器人像人一样能听、会说、能理解、会思考,用人工智能建设美好世界。
可以看到,科大讯飞经过多年的探究,其语音合成超过了真人说话水平,包括中文、英文等多语种,并且为中央电视台《创新中国》栏目进行配音等。刘庆峰直言,“如果播音员的成绩是5分,普通人讲话是4分,那么机器已经平均做到4.5分以上,机器的语音识别准确率大概可做到95%以上,甚至是97%。”
据刘庆峰介绍,目前,每天有上亿的用户在使用讯飞输入法,平均准确率高达98%以上,超过了最好的人类速记员。“可以看出,在各个领域机器取得了越来越多的进展,从感知到认知,正是如此人工智能改变世界的时代已经到来了。”刘庆峰透露,下一步科大讯飞要不断地向无监督训练延伸,如何用更少的数据、更少的标记学到更好的效果等。
已在多方面解决“卡脖子”问题
2019年10月,8家人工智能企业被列入美国实体清单,科大讯飞便在其内。“被列入实体清单之后,我们的核心技术到底怎么样了?是大家极为关注的问题。”在大会上,刘庆峰介绍了两大技术。
语音是下一步万物互联时代的关键入口,所有的手机、智能穿戴设备、智能家居如果,没有语音交互和语音助手,没有语音输入法,基本上难以实现出口,是一个典型的卡脖子工程。“科大讯飞被列入实体清单之后,因为在无监督技术上的显著进步,可以使得原来要一万小时才能训练的一个语种的语言识别和翻译,现在一百小时就可以实现,所以我们迅速地做了60个语种的全球的语音识别翻译和合成,其中33个语种已经超过谷歌,包括英语、法语、西班牙语、俄罗斯语、日语、韩语等。在欧洲发布华为P40手机的测试效果,英语、法语、西班牙语都远超苹果手机和谷歌提供的原来的效果,所以这使得我们在多语种技术上已经彻底解决了卡脖子问题。”
此外,图象识别也在很多领域刷新了记录。刘庆峰称,一个非常典型的案例就是复杂公式,在高考的机器阅卷中复杂公式多,数据量极小,目前机器也突破了原来的门槛和瓶颈,所以正是因为这些技术的进展,人类已经进入到了一个“人机物”万物融合的万物智能互联时代。
目前及未来,无屏幕设备将会越来越多,十年或者二十年之后,如果没有人工智能陪伴机器人进入家庭,人类的晚年生活将会很难有幸福而言。“在‘人机物’万物互联时代,机器人进家庭,一定犹如人跟人一样的交流。且是以语音为主,以触摸键盘为辅的人机交互时代,在这个领域中,从核心技术和产业应用上中国已经不光不会卡脖子,其实走在全球的前列。”
此外,刘庆峰还提到,在1024全球开发者节上发布了讯飞虚拟人交互平台的1.0,这也是行业首次定义真正未来的虚拟人交互平台,目前已存在54位虚拟人家族。
以大屏为核心的智慧家庭解决方案时机已成熟
在智慧家庭方面,科大讯飞也有多年运营积累,刘庆峰举例称,电视在每个家庭几乎是存在的,针对中国最典型的一老一小的问题(老年人视力问题、使用习惯、操作能力的问题;孩子们的视力保护问题等),通过语音交互,极大地可以提升用户在家庭大屏上的使用,而且把大量的移动互联网应用如果移到电视大屏上会极大的提升整个家庭的幸福感,不仅仅是操作方面,整个家庭亲情的场景会重新汇聚起来。
据悉,截至2021年10月,讯飞电视语音助手累计覆盖数超1.96亿,激活用户超5000万。目前,正在从规模化运营转型成价值运营,从家庭视听场景走向家庭全场景服务。“我相信下一步不仅是语音交互,还有大量的全新的空间,通过大屏对整个家庭的控制中心打造,联动所有硬件,通过大屏可以把更多的服务场景在家庭呈现。”在刘庆峰看来,打造以大屏为核心的智慧家庭解决方案,持续丰富教育、健康、生活等场景时机已经成熟了,他希望在中国移动的带领下,在移动的大平台下共同带动整个家庭大屏生态的全新繁荣。
人工智能从来没有像今天这样触手可及,不仅仅可以帮助人类,还可以陪伴人类,还在不断地更懂人类。刘庆峰直言,“科大讯飞的使命和梦想之一就是未来要让每个人都站在人工智能肩膀之上,每个家庭都站在人工智能肩膀之上,而最好的载体,就是与中国移动共同打造的家庭大屏入口,我们期待着用人工智能建设一个更加美好的世界。”