小智智能音箱,脱离手机,用语音控制的智能音箱
导语:小智智能音箱采用的就是wifi连接的技术,但已经可以脱离手机单独实现智能化。与市面上现有的音箱产品相比起来,小智智能音箱就有了三个典型的功能特点:语音识别、语义分析、个性化。
“小智,放一首欢快的音乐”、“小智,上午10点记得打开空调”、“小智,下午2点提醒我开会”、“小智,今天天气怎样”,以上都是聚熵智能推出的小智智能音箱几个主要的功能。
上次在《从中国版Siri到传统硬件智能化,聚熵智能经历了什么?》中介绍了聚熵智能这个以语义分析、人工智能技术见长的公司为什么要专做智能影像,把人工智能技术用于这种非常传统的设备上,也提到了这款小智智能音响。18号,这款新产品开始众筹。现在我们可以详细看看这款产品。
其实以上四个功能,最主要的还是语音控制音乐播放功能。其他三个功能为辅。至少目前是这样。聚熵科技的创始人何永打的如意算盘是,把智能音箱功能单独拿出来也是个很大的需求,这是个目前完全可以独立出来的大功能。用户花钱买个智能音箱,以后智能设备普及了,还可以直接和智能设备等联动,其实是赚到了。这样的产品,比目前的智能设备更能捕获消费者的芳心。
在确定了要对传统硬件行业做智能化改造这个方向之后,他们根据聚熵智能之前推出的语音助手产品里的需求比例,考虑要将其中占比最大的听歌功能放大。他们调研了市场很多的音箱产品和用户,发现现在全世界音箱产品的使用方法都太传统了,他们觉得可以把聚熵智能的语音、语义分析技术应用到这上面。这样,与市面上现有的音箱产品相比起来,小智智能音箱就有了三个典型的功能特点:语音识别、语义分析、个性化。
就像文章开头的几个请求当中,在正常声音环境下,三五米内用正常音量对音箱说话,它是完全能接收到的。放什么歌,这就涉及到人工智能了。比如文章开头说到的,“放首欢快的歌儿”,欢快这个词就比较抽象。同样,可以说“放首浪漫的歌儿”,“放手莫文蔚的歌儿”,“放首周杰伦的青花瓷”等等。甚至直接说“来,小智,放首歌儿”也是可以的,它会根据用户以往的点歌习惯来播放,这就是个性化。这些效果的实现,都是基于算法和机器学习,这是聚熵智能自己专门针对音箱这一功能研发的。而音乐来源,就是和天天动听合作,调用的对方的曲库资源。
不过,因为小智智能音箱的语音语义识别目前主要支持中文,所以点播外文歌曲还需要在算法上进一步拓展。
在通讯连接方式上,小智智能音箱采用的是wifi连接技术。基于这个技术,何永把小智智能音箱称为第三代智能音箱。第一代和第二代智能音箱都需要用手机来操作。区别在于和手机的连接方式上。第一代音箱产品,需要用线将手机跟它相连。这样的缺陷是,手机移动起来就不方便了;第二代则是用蓝牙技术。这样,在每次用之前都要把二者进行蓝牙配对。可以在一定能够范围内把手机解放出来了,但是蓝牙配对还是有其一定的局限;而第三代智能音箱则是用wifi连接,但大多还是需要跟手机连接。
小智智能音箱采用的就是wifi连接的技术,但已经可以脱离手机单独实现智能化。这借助的就是语音人工智能。wifi连接技术也经过了一个演进过程。第一代是IP热点技术,先把手机设个热点,再用手机连接设备,用手机输入账号密码传到设备上,然后设备再去连路由器。网速不好的话也容易配对出错。第二Smart Link代连接技术是直接把账号密码输给智能设备,让其脸上路由器。但是目前这个速度目前还是很慢,大概20-30秒。小智智能音箱采用的是声呐识别方式,通过声音把账号和密码告诉设备使其联网。
但是,小智智能音箱具有上下兼容的特点。既有采用wifi连接的音箱的特点,比如和手机连接,只要手机是联网的,也可以直接把手机上的音乐分享到音箱上面。也有语音控制等特点。
小智智能音箱不仅能自己用wifi联网,还能帮助其他智能设备联网,进而实现联动。它已经开发了接口,只要接入了它的开放协议的智能设备,就可以实现这个效果。智能设备在安装进一个家庭的时候,都需要进行联网设置。但接入小智智能音箱开放协议的智能设备,只要插上电源,就能被小智自动识别,然后帮其连上网络。然后,就可以用小智来遥控这些智能设备了,比如像文章开头提到的,定时开空调等等。因为小智智能音箱会不间断检测其他智能设备的无线信号,只要对方插上电,小智就能识别出来。
天气查询的功能其实比较像聚熵智能的语音助手软件实现的功能,只是被内置到了音箱这个硬件设备当中。值得一提的一点的,像文章开头,“小智,今天的天气怎样”,这个提问中,并没有告诉小智具体的地点,因为它可以根据wifi网络判断位置。当然,如果在北京的家中,问小智“上海的天气怎么样?”这也是可以的。但不提示位置,它默认的就是wifi网络所在的位置。
何永介绍,目前,聚熵智能只专注做便携式音箱,不做大的音箱设备。但聚熵智能也可以单独把小智智能音箱的整个语音语义方案开放出来,跟传统的硬件生产厂商合作的。向那些大的音箱制造商提供软硬件解决方案。但聚熵智能的主要精力还是会放在2C上。接下来,会为小智智能音箱开发多种语音支持功能,进一步做海外市场。