AI“解剖”语言又获新技能!谷歌开源SyntaxNet自然语言解析器

雷锋网  •  扫码分享

AI“解剖”语言又获新技能!谷歌开源SyntaxNet自然语言解析器

虽然现在的AI已经发展到了相对成熟的地步,但是它仍不能识别和解析自然语言。而Google一直都在努力打造一套系统来帮助AI理解自然语言。现在,Google在此领域的研究终于初见端倪。

近日,Google发布了开源的SyntaxNet自然语言 神经网络 框架,以帮助机器更好地理解自然语言。SyntaxNet中包括了Parsey McParseface,后者是一种专门用于“解剖”英语的语言解析器。Google称之为世界上最准确的语言解析器,并且已经放出了允许人们借助自有数据来训练SyntaxNet的全部代码。

SyntaxNet和Parsey McParseface都是自然语言理解(NLU)系统的一部分。给出一个句子,它就会将之分解成各种部分,比如名词、动词、形容词。

对自然语言研究人员和需要这种应用程序的人们来说,这款开源工具显然会助力相关研究的爆发式发展。

据Google自述,经过TensorFlow框架训练后的Parsey McParseface,是其出产的“最复杂的网络”之一。

在某一测试中,他们发现该模型的准确度超过94%——作为比较,训练有趣的语言学家的准确率在96-97%左右——这表明该软件的技能熟练度已与人类相当。

看到这里,如果你对SyntaxNet的运行方式还是不甚其解,那小编给大家一个比喻:Parsey 和SyntaxNet就像5岁孩子学习句法结构一样。

AI“解剖”语言又获新技能!谷歌开源SyntaxNet自然语言解析器

在上面这个句子中,“saw”是基本词(动词),”Alice”和”Bob”是非基本词(名词)。Paesey McParseface能正确地分析这一句子,也能理解下面这个更加复杂的例子:

AI“解剖”语言又获新技能!谷歌开源SyntaxNet自然语言解析器

Alice drove down the street in her car.

对于开发此自然语言神经网络框架的原因,Google是这样回应的:

解析语言最大的挑战就是人类语言有很多歧义,一个正常长度的句子(20到30字)也许有上百、上千,甚至上万中句法结构。而要一个自然的语言解析过程就是扫描所有句法结构,然后找出最合适的句法结构。

而虽然Parsey McParseface 和 SyntaxNet看起来牛逼哄哄,但它并不是自然语言解析的最终方式,它只是GoogleAI语言解析的第一步。

Via: TNW

随意打赏

谷歌新logo谷歌人工开源开源编程语言谷歌ai围棋谷歌围棋ai谷歌新总部谷歌开源谷歌ai
提交建议
微信扫一扫,分享给好友吧。