首发 | 为创业2次抛弃微软,清华北大学子联手创办,Atman上线3月碾压谷歌、百度翻译

创业邦  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

首发 | 为创业2次抛弃微软,清华北大学子联手创办,Atman上线3月碾压谷歌、百度翻译 对于不是英语或特定语种专业出生的普通大众而言,一篇无一丁点母语的长篇大论甩你面前时,首先想到的是谷歌翻译,百度翻译,然后翻出的句子连不起来啊,还是不懂,接着瞬间满脸蒙哔了是不是?

如今得益于人工智能、深度神经网络学习、大数据等的快速发展,翻译已逐渐被颠覆。机器翻译能模仿人脑 “理解语言,生成译文”。

其准确度、流畅度都得到大幅提高,甚至达到 “译文流畅,符合语法规范,易于理解” 的状态 再拿到一篇陌生语种的文章时,不会出现看不懂的情形。

所以, “未来人工智能解决语言障碍就像水电一样去融入人们的生活,成为生活的一部分,甚至感觉不到它的存在”,Atman的创始人兼CEO马磊这样对创业邦(微信搜索:ichuangyebang)说。

Atman是国内少有关注机器翻译并追求自动化的一家 创业公司 ,2016年6月18日正式运营,目前已获得北极光天使轮投资,估值4000万人民币。

十年机器学习经验,两进两出微软,后创办 Atman

在互联网圈做算法的 “攻城狮”们是令人佩服的,他们身上也拥有了典型的理科男特质:简单、淳朴。初次见到马磊就是这样,谈话间不会用过多华丽的辞藻形容自己的公司,自己的团队。一个多小时的采访基本被十年多的工作内容和对行业激情占满。

马磊,清华大学计算机系毕业,曾在微软研究院和微软搜索中心供职过,在后者担任 Cortana 及相关产品构架师,专长是机器学习。 曾完整撰写过语音识别、统计机器翻译( SMT )的解码器( Decoder )代码。 有丰富的 Bing 搜索的海量数据做传统和深度机器学习的经验。

第一次离开微软是为了创业,也就是 10 年前出来做基于内容搜索的在线教育,当时的他想,一个工程背景很强、对算法清楚的人,不会跨越不了研究、 产品运营 推广等这些阶段,但事实证明,还真没跨越过去。

再次回到微软后,马磊吸取创业教训,来到工程院搜索技术中心,在产品部门待了三年多,潜心学习。也是在这期间,认识了如今一起创业的团队成员,他们之间对彼此的品质了如指掌。

这其中就有 Atman CTO 刘炜,毕业于北大电子系, 擅长工程实作和 团队管理 ,思维稳定细致 马磊告诉创业邦(微信搜索: ichuangyebang ),“其实一开始刘炜是不愿意创业的,被我天天浇水,有天开花了就出来一起干了”。

第二次离开微软后,马磊创办了 Atman ,已经有着 10 多年的机器学习经验,带着微软的文化基因,对二次创业可以说做了充分的准备。

Atman 的核心:解决翻译的流畅度

生活中我们所熟知的好点的翻译工具无非是谷歌翻译、百度翻译,但当你使用的时候,会发现一个问题:即便你有一定的语言知识,这类工具翻译出的句子依然是晦涩难懂的。它需要我们对句子重新进行组合,以便符合人类的感知行为。这其实超过 50% 的工作需要我们自己完成。

更别说一些专业领域,比如医药、法律等,都是人工在翻译,因为目前不存在机器翻译可以胜任这样一份工作。

所以,不同于这些做广谱翻译的大公司, Atman 的翻译平台目的在于打通翻译的障碍,平台不分语言,只要有数据,机器就能自己学习。机器从 0 开始进入一个领域(零成本进入)也只需要 2 周时间。所以,进入哪个领域都能高度垂直的做下去。

比如,财经类文章翻译,世界好的财经网站的文章总和不超过 1000 万篇,让机器学习一遍这些文章,就可以保证财经类文章的翻译有 95% 的流畅度,而且能做到实时同步。而这一过程,机器模型自身也会变得越来越好。

马磊很开心地表示,你以前用谷歌的翻译,能把人工降到 50% (可能还没一半),加入我们平台后降到 10% ,不用再疲惫地去看网页翻译,阅读的心情都不是一个量级的。

当然,他也坦言, “我们期望人尽量少去对翻译出的文章进行编辑,但现在完全取代人还不可能,毕竟人类的感情、情绪、隐喻的东西对机器而言还是有难度的,但未来应该可以解决”。

所以,在马磊眼里人工智能时代, 商业模式 是会被颠覆的。

目前, Atman针对C端用户 有一个 “量子镜”项目计划。目标是精选国内用户会感兴趣的国外高质量内容网站,通过机器翻译技术,提供翻译后的中文内容给国内用户阅读(按照目前单机的翻译速度,镜像一个百万文章级别的内容网站,需要一个月左右时间)。

而对于 B端 用户:机器翻译主要 对某个垂直领域 进行翻译 。另外, 接下来几个月 计划开发智能的 CAT软件,以辅助B端客户做最终的人工校对。

为什么是 Atman而不是巨头在做这件事

世界上能写成文字的语言大概有 300多种,它们就像互联网里面的一个大群,这些群目前还没有沟通,相当于信息孤岛(语言障碍)。而机器翻译能把信息孤岛连接起来,之后整个世界就可以像微信朋友圈那样了。

10年前,一家公司流畅性地翻译全世界的语言,有人感想但做不到。因为根本没有技术基础可以进行突破。

如今,人工智能的快速发展让这一想法得以实现,但世界的公司都处于这样优越的条件,包括很多世界级的巨头,为什么偏偏是 Atman这样的创业公司先发制人?

首先:团队,人才没有区别,但从项目投入的 人力资源 上反而比大公司好,因为大公司审批机制比较落后。

第二:项目进度,立完项目,创业团队所有人精力都会搭在这个项目上, 单点项目上绝对人数比大公司多。

第三:马磊认为 创业公司狼性文化更强,这点很重要

第四:资金投入,大公司关注所有项目, 单点的投资就不如创业公司。

但马坦言,像 Atman 这样的创业公司在方向性上的风险更大,对于大公司而言,无非白投了。而对于创业公司,可能意味着人员重组或者更严格的变动等。

但不管怎样,马磊告诉创业邦(微信搜索: ichuangyebang),“至少从技术角度,在垂直领域翻译这块Atman是第一梯队的”。

BLEU 评分 也证明了这一点:

首发 | 为创业2次抛弃微软,清华北大学子联手创办,Atman上线3月碾压谷歌、百度翻译

(政治领域的机器翻译和主要翻译服务提供商的评分)

注: BLEU 评分是国际上通用的客观评测机器翻译质量的指标。

随意打赏

提交建议
微信扫一扫,分享给好友吧。