微软 Seeing AI :让盲人也能“看见”这个世界
提到人工智能,如果你只想起下围棋的话就太弱了。除了下围棋,人工智能正在越来越多的方面帮助人们,例如,在微软,人工智能正在帮助盲人“看见”这个世界。
上周三,微软首次公布其 Seeing AI 应用 ,尽管仍在开发之中,但看起来既惊人又靠谱。
通过使用手机摄像头和一副配备摄像头的智能眼镜,Seeing AI 应用能够辨认你周边的环境,物体,甚至情绪,以帮助盲人更好地理解身边正在发生的事情。
Seeing AI 展示视频
首先来认识下萨基博·萨科( Saqib Shaikh )
Saqib Shaikh 是Seeing AI 团队的核心成员。七岁时, Saqib Shaikh 七岁失去了视力。之后,Shaikh 在盲人学校中接触到了计算机的相关知识,这启发了这位少年成为程序员。10年前,Shaikh 加入了微软,成为一名软件工程师。
在大学时期,他就一直梦想着能够开发一款能够随时随地告诉你身边正在发生什么事情的应用。
利用微软人工智能 API,Shaikh 和他的同事开发了这款结合手机以及 Pivothead 智能眼镜的应用:Seeing AI 。只需要轻轻滑动眼镜镜腿,你就能“看到”眼前景象。
(注:Pivothead 是一家创建于 2010 年的智能眼镜创业公司。)
作为软件工程师,萨科也参与了Seeing AI 项目的开发与测试。
在 Build 2016 大会上公开的 Seeing AI 视频中。 萨科带着 Pivothead 智能眼镜时,滑动镜腿就可以拍下眼前看到的景象。
微软 AI 说到:“我想这是一个男人正在玩滑板,跳到空中”
在与人谈话时,这款应用能让盲人像普通人一样参与讲话。通过滑动镜腿拍照,Seeing AI 不仅能够告诉你人们有没有在听你说话,还可以描述你身旁的人的大致年龄和性别,甚至是他们的情绪。
“我看到两张脸:40岁的男人脸上带着惊讶的表情,20岁的女人看起来很开心”
不仅如此,这款应用还能精确地阅读文本。
只需要通过应用对文本拍照即可,应用还会引导以确保你拍下你正在“看”的完整文本。
例如,微软 AI 会指导到:“将摄像头移到右下角并且离文件远一些”
一旦你拍下照片,微软 AI 就会辨认文本。它甚至还能先略过标题以确保万一你并不想知道餐厅菜单上的每一个项目。
萨科在视频最后表示,“多年之前,这是科幻小说才有的场景。我不曾想到这会变成现实。但人工智能的发展速度令人难以置信,我非常激动自己可以感受到这些。作为工程师,我们一直站在巨人的肩膀上,推进我们多年来的研究。这个项目的背后,就是微软多年的研究努力。对我来说,这是一步步将梦想变成现实,而这只是一个开始。”
素材来源:TechInsider
原文作者: Dave Smith
编译:雷科技(公众号:leitech)