讯飞星火认知大模型3.5升级发布 讯飞输入法AI能力再提升
1月30日,科大讯飞举办星火认知大模型V3.5升级发布会,展示大模型底层能力到应用场景的新发展,同时也发布了讯飞语音大模型。科大讯飞董事长刘庆峰表示,“今天的通用人工智能必将像PC和 互联网 的诞生一样,深刻改变人类的生产生活方式。”随着星火认知大模型V3.5的发布,讯飞输入法借新技术持续赋能,不断升级生成式AI输入能力,在万物互联时代带来更出众的人机交互体验。
2023年8月,讯飞输入法推出“AI创作助手”,覆盖6大表达场景,适配60多款应用,使亿万用户感受大模型的“模”力。同年10月,讯飞输入法全新发布13.0,量身定制“高情商沟通”、“润色达人”、“智能回复”、“帮你扩写”等场景化功能,提供生成式AI输入服务。2024年1月30日,讯飞星火V3.5已在语言理解、数学能力上超过了GPT-4 Turbo。与此同时,讯飞输入法基于星火大模型的底座和用户新生需求,生成式AI能力再提升,匹配更多元的场景,拥有更深层的理解,生成更丰富的表达。
“讯飞星火的技术进步,来源于真实世界刚需。”
创业 之初,科大讯飞的梦想和使命就是要实现人机信息沟通无障碍。当下的大模型带来了语音技术发展的全新机会,使语音识别可以进一步突破高噪、远场、多人说话这些传统的“鸡尾酒会语音识别”重大难题。这一次基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,全新升级助力更自由的沟通,推动万物互联时代下的人机交互变革。
科大讯飞创业25年来,在智能语音这条赛道上一路驰骋,持续走在世界前列。2006-2019年,连续十四年蝉联国际语音合成大赛冠军;2016-2023年,连续4届获得国际多通道语音分离和识别比赛CHIME冠军;2021-2023年,连续三年获得国际语音翻译比赛IWSLT赛道冠军;还参与承建首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心等,在语音领域持续积累。
此次星火语音大模型将识别、翻译和多语种分类等多种功能统一交换并进行训练,实现了多种任务信息的共通,会对整体任务产生促进作用,使语音识别效果大幅提升。其中,多语种自动识别已覆盖37种,端到端语音翻译超过13个。在训练层面,通过两种方式,即多模态理解和多模态生成两种任务的协同训练,来实现多模态的协同。
作为深耕互联网行业14年的老牌应用,讯飞输入法AI语音输入,支持26种方言、5种民族语言以及30种外语,令表达更方便、更透彻,同时能够理解上下文语义关联。在星火语音大模型赋能下,全语音自然交互的讯飞输入法旨在实现智慧表达,智能连接。
当下,生成式AI的赋能已经成为一种趋势。对于大众而言,一款生成式AI输入法,是最方便、最直接、最轻量的大模型使用端口,打字就能使用生成式AI的多模态服务。可以看到,源于真实世界刚需的产品创新,在应用场景和社会价值方面潜力巨大。