阿里巴巴发布AliGenie2.0系统:从语音战升级为视觉战
腾讯科技讯(孙宏超)3月22日消息,在2018年春季发布会上,阿里巴巴人工智能实验室并没有发布太多新硬件产品,而是将重心放在了系统升级上。
今天阿里巴巴人工智能实验室宣布发布人机交互系统AliGenie2.0版本,在原有“听”和“说”的交互体验基础上,引入视觉能力,能够进行视觉认知、多模态交互、情景感知。在AliGenie2.0的支持下,“天猫精灵”将成为首款能“看见”的智能音箱。
阿里巴巴人工智能实验室负责人浅雪表示截止到今年3月中旬,天猫精灵累计销量达200万台,持续领跑中国智能音箱市场。在这背后,AliGenie 1.0“听”和“说”全新的交互体验获得了市场认可。AliGenie 2.0引入视觉能力,将为天猫精灵带来新的能力升级。
据介绍,AliGenie 2.0的视觉能力包括图像识别、人脸识别、物体检测。AliGenie 2.0还引入多模态交互能力,通过对语音、图像、触摸等多种交互形态的融合,让机器和人的交流,更像是人与人之间的交流。同时,AliGenie2.0还具备情景感知能力,基于所在的上下文、对话场景自主学习,深刻理解情景需求。未来,AliGenie将不仅能识别“命令”,还能理解“情感”,并且进行情感反馈。
“行业真正需要的不是销售数字,而是持续创新的力量。因此我们选择发布这样一套系统,希望带领行业向更高维度进行能力升级。”浅雪表示。
另外,今天阿里巴巴人工智能实验室还发布了天猫精灵曲奇版、智能投影天猫魔屏S1和天猫路由器等智能硬件。