所译即所学的DuoLingo获1500万美元融资,将众包翻译和外语学习融为一体
如果让刚开始学一门新外语的你去参与网页内容翻译,是不是有些意外?可
\nDuolingo就能让这事发生。这个将众包翻译和外语学习交融在一起的网站在正式上线的三个月后获得了由NEA领投的1500万美元B轮融资,其A轮投资者Union Square Ventures也参投。
DuoLingo的模式可谓是\"一箭双雕\",让人们免费学习外语的同时也利用众包完成其他网页内容的翻译,或者说是以外语学习为激励让人们免费做网页翻译的工作。DuoLingo从听说读译方方面面来帮你打开通向新语言的大门。学习新单词时DuoLingo会配以图片和读音帮你加深记忆,且用听写单词、看图猜词、检测你发音等多样化的方式让你在练习中巩固所学的语言知识。
在你学完一定量的单词和语法知识后,DuoLingo会在练习中让你翻译句子。这些句子都是取自实际的网页内容,而不是现成的外语教材,你不用去学那些普通教材编写者所杜撰出来的\"常用对话\"了。
这些待翻译的句子并不是随机分配给外语学习者,而是针对不同用户的学习程度来给出适宜难度的句子。比如所给的句子中可能就涵盖你刚才学完的新词和语法结构,若你还没完成现在进行时的时态学习,DuoLingo就不太会分配给你这个时态的句子。DuoLingo也自有一套保障翻译准度的机制,而不会直接采纳某位用户的翻译。它会比对各个用户对同一个句子的翻译相似度,如果相似度都很高则可以确定下正确的答案。除此之外,用户也对其他人的翻译进行投票,这样DuoLingo就能综合考量出最恰当的翻译。
游戏化和社交化也被融入DuoLingo中。学习过程中你会有持续的积分刺激,你也可关注你的好友互相监督学习进度并结识与正和你学习相同语言的朋友,DuoLingo还开辟了问答社区,供学习者发问并讨论。
DuoLingo承诺会(对学习者)永久免费,且网站也不会放置广告。而盈利方式则是向翻译需求方收费。机器翻译往往较干涩,而DuoLingo的人工翻译显然会更有\"人情味\"。现在通过DuoLingo上传待翻译的文件并获得译稿是免费的,但后续DuoLingo会针对翻译速度和准度收取一定费用。网站现有周活跃用户25万,人均每天停留半个小时。DuoLingo不久也会推出移动客户端。
Luis von Ahn是DuoLingo的创始人,他成长于危地马拉(拉丁美洲国家,官方语言是西班牙语)。他发现对于不会英语的当地亲戚而言,可供阅读的网页很少。即便是在互联网中,这种由于语言而产生的信息隔阂仍很明显,而打破这种隔阂就要翻译网页内容。那何不利用众包来翻译整个网络?怎么才能让成千上万人来免费做这件事呢?正如上文所说,DuoLingo就在外语学习和翻译众包这两者中搭建出了双赢模式。
你可能并不熟悉Luis von Ahn这个名字,但你一定熟悉每天都在输入的网站验证码。验证码(CAPTCHA)就是2000年Luis von Ahn(当时他是CMU博士生)和其他几位学者共同研究出的用于鉴别在屏幕前的你到底是人类还是机器的方法。而到了2007年,von Ahn先生也为人们每天在输入验证码上浪费过多时间而\"感到愧疚\",于是reCAPTCHA诞生了。(后来reCAPTCHA被google收购,用以图书数字化和
\n街景中路牌识别。)
\nreCAPTCHA让你在输入验证码的同时也为纸质书籍的电子化做了贡献,它会给用户呈现出两个单词,其中一个单词是计算机已知道的(这个单词就用于确认你不是机器),而另外一个单词是从扫描的书籍中摘取下来计算机识别不清的。如果你输对了那个验证码单词,计算机会记录下你识别出的那个模糊单词。再比对几个人对同一个单词的识别,最后就能确定书籍中的那个模糊单词究竟是什么了。
\n
DuoLingo和reCAPTCHA一样,都是利用众包式的人机合作(
\nHuman Computation)模式来解决单凭借计算机或人力都难以完成的事情。计算机的规模处理能力很强大,但仍有许多需要人类智慧的地方它不太擅长。虽然人类没有计算机这么强大的处理能力,但如果合理分解任务,再委派给大众,则效果会好到出人意料(想想维基百科)。可试用一下DuoLingo,以新的方式学语言并为消除网页内容隔阂做点小贡献。
另:Luis von Ahn在这个
\nTED演讲(可选中文字幕)中讲述了reCAPTCHA和DuoLingo的由来,并介绍大规模在线合作模式,推荐观看。
source:
\nDuoLingo Blog,
\nWired,
\nnytimes