百度机器翻译项目获中国电子学会科技进步一等奖
中新网4月20日电 19日,第十届中国电子信息技术年会在北京万寿庄宾馆举行。由百度牵头与中科院自动化所、浙江大学、哈尔滨工业大学、中科院计算所、清华大学联合研发的《基于大数据的互联网机器翻译核心技术及产业化》项目获得科技进步一等奖。项目成果被院士专家鉴定为“在多策略融合翻译等技术方面取得突破,在翻译质量、翻译语种方向、响应时间三个指标上达到国际领先水平,并取得了显著的经济效益和巨大的社会效益”。
在全球化背景下,互联网大数据为机器翻译研究带来了前所未有的机遇与挑战,传统翻译模型和方法亟待创新。百度此项项目在海量翻译知识获取、翻译模型、多语种翻译技术等方面取得重大技术突破,解决了传统方法研发成本高、周期长、质量低的难题,实时准确地响应互联网海量、复杂的翻译请求,使我国掌握了互联网机器翻译的核心技术,占据该领域的技术制高点,同时也促进人工智能技术的发展。
百度技术副总裁王海峰在论坛现场做主题为《互联网机器翻译及产业化》演讲
基于在互联网大数据方面的多年积累,百度机器翻译团队研发出海量、高质翻译知识获取技术,突破了传统方法在知识获取方面规模小、成本高的瓶颈;提出了创新的基于互联网大数据的多策略翻译模型,突破了单一方法的限制,实时响应每天来自全球超过上亿次复杂多样的包含网络新词、科技文献、电子商务、古文、粤语等多领域、多文体的翻译需求。为了进一步提高翻译质量,该项目在翻译消歧、译文调序、小语种翻译等世界性难题上提出创新的解决方案。项目申请专利40项,已获授权17项;制定国际标准1项;取得软件著作权34项;出版专著3部;发表领域顶级论文90余篇。
据了解,多年来百度牵头并联合国内著名高校和研究机构,积极深入的开展机器翻译相关研究及产业化应用,受到国家高技术发展研究计划(863计划)支持,并将此作为国家战略重要组成部分的高技术提升至国际领先水平。
除了在学术领域取得了丰硕的研究成果外,该项目也取得了巨大的经济和社会效益。项目成果已应用于国家多个重要部门和“百度翻译”等产品中,覆盖全球超过5亿用户。通过免费开放API,该项技术成果支持了包括华为、敦煌网等企业的超过7000个第三方应用,有力地提升了我国中小企业的开放创新能力,带动了相关产业的繁荣与发展。如“敦煌网”等电子商务网站通过使用“百度翻译”进行跨境贸易,更加有效地帮助平台上的买家和卖家完成交易,跨越语言障碍,真正做到了外贸的无障碍交流。
随着科技和社会经济的快速发展,全球的互联互通潮流也为机器翻译提供了适合孕育的土壤。小到出国旅游、科技文献翻译,大到国际贸易、跨语言文化交流,不断深化的多语言信息联通正不断催熟着机器翻译研究与产业化的快速升级。
首个多语翻译机器人小度与海外嘉宾互动
百度技术副总裁王海峰表示,“语言是人类区别于其它生物的基本能力。不同语言之间的翻译更是只有少数人才能做到。采用器翻译技术自动实现语言之间翻译是人工智能的终极目标之一。过去几年里,我们取得了一系列基于互联网大数据的机器翻译关键技术突破,百度翻译每天收到的翻译请求量已经上亿,满足了广大用户多方面的翻译需求,也带动了很多相关产品和产业的发展。”
中国工程院院士倪光南也在大会上表示,机器翻译现在拥有强大的工具,可以把大数据的威力充分发挥出来。百度这方面在全世界占有领先的地位,“我相信我们在这些领域做好,通过机器翻译促进机器智能的发展。”
中国工程院院士倪光南在论坛上发言
不仅在国内,百度机器翻译取得的成果在国际上也受到了广泛关注,国际机器翻译协会主席、《机器翻译》主编Andy Way,电气电子工程师学会兼美国计算机协会音频、语音及语言处理汇刊主编李海洲,美国计算机协会智能系统和技术处理汇刊创办主编杨强等多位在人工智能、机器翻译领域的海外专家学者纷纷表示,机器翻译是人工智能的终极目标之一,得益于在自然语言处理方面的领先技术优势与不懈的创新努力,百度翻译在人工智能研究中取得了瞩目成绩,能够帮助人类拓展自身能力,让生活更美好。
业内人士表示,几十年来,作为自然语言处理领域最重要的研究方向之一,自主研发的机器翻译技术不仅在学术领域具有重要意义,更成为了全球互联世界里的一种跨文化贸易交流推手、战略性信息安全资源、甚至产业化助推器。在单语世界到多语世界的发展潮流中,机器翻译技术正在逐步改变人们的工作和生活方式。也许三五年之后,如今在很多人眼中仍属于“高大上”的机器翻译将不断融入大家的日常生活中,机器翻译产业必将引领新一轮产业浪潮。(中新网IT频道)