准确率98.66% 四个完全不懂日语的码农开发出了日语识别软件
人工智能走进现实世界的步伐比你想象中的快得多。
虽然阿尔法狗在围棋领域的实力让人印象深刻,但是机器智能也进化到可供更多人使用。这也是为什么四个几乎完全不懂日语的码农能在短短几个月的时间开发出可识别手写日语的软件。
这些程序员来自成立仅 18 个月的创业公司 Reactive,他们开发的手写日语识别程序准确度高达 98.66%。这家位于东京的公司是一个由码农和投资者组成的社区中的一员,该社区致力于利用神经网络将人工智能用于更加实际的用途,而不是回答一些鸡毛蒜皮的小事,或者在棋盘类游戏中获胜。
「仅仅在几年前,只有天才才能开发出这类软件,」David Malkin 说,他有着机器学习领域的博士学位,但不会说一句完整的日语。「而现在,利用这些工具你就能成为非常聪明的人。往后,就是关于如何运用想象力将这些工具应用在现实世界。」
曾经,人工智能是 Google、Facebook 等其他科技巨头独有的技术、现在,任何一家深度学习相关的创业公司都可以利用基于云端的平台开发产品,微软、英伟达和亚马逊把人工智能当做工具一样销售。
Reactive 公司的技术表明,再小的团队,在一点点专业知识的辅助下,也可以开发出复杂的应用。也许,产品不是问题,如果实现盈利才是需要认真思考的。Reactive 计划利用该软件帮助日本学校阅卷。
Malkin 和他的同事 Joe Bullard, Philippe Remy 和 Philip Irri——其中有两个硕士,一个博士——的进展很快。年初,Bullard 就在 Google 日本总部的一次社交活动上向人工智能爱好者展示了公司的项目,表现堪称完美。
在很多人看来,笔迹识别对深度学习而言小菜一碟,但日语是截然不同的。这是因为日语中包含象形汉字字符,由可独立读取的部分组成,所以很难判断字词的开始和结束。日语中还有超过 2000 个象形文字,每个文字又有多个笔画。Reactive 的算法利用神经网络进行多次匹配,得出最准确的结果。该公司使用了大约 180 万字符训练该模型。
「就识别速度和可塑性而言,该技术在商业领域的应用于该领域的专家相比有着较大的优势,」Fujitsu Laboratories Ltd 项目主管 Seishi Okamoto 说,他正在开发可识别汉语的软件。「深度学习识别汉字书写的准确率与人类相当,也许还会超越。」
传统的编程是建立在固定的规则上的,写 C 程序就必须按照 C 程序的语法结构来。但是深度学习人工智能是建立在人类处理信息的模式上。给定足够的输入信息,以及期望的结果,神经网络负责中间流程。这就能解决传统方式头疼的问题,如语音指令和图片标记。
这些都有可能推动人工智能技术的发展。市场研究机构 CB Insights 数据表明:2015 年,人工智能领域创业公司投资,从教育到零售业,再到农业,达到了 3.1 亿美元,在五年内增长了 7 倍之多。
文章来源: bloomberg 由 TECH2IPO/创见 陈刚编译,首发于创见科技,转载请注明出处。