能识人能断字,微软发布的这款App将手机镜头变成盲人的眼睛
近日,微软推出了一款用于iOS设备的“可说话相机”应用程序Seeing AI,旨在帮助视力障碍者“游览”周围世界。该应用能够通过扫描文件或条形码来读出内容,告诉用户手中的帐单或者握着的其他东西。此外,它还可以辨别人们见过的面孔,识读他们的表情,甚至能描述用户面前发生的一切。
显然,Seeing AI要想真正成为视障者的得力助手,微软仍有大量的工作需要去做。微软公司也很清楚这一点。因此,该应用启动时首先呈现给用户的便是一则警告:Seeing AI并不总是完全正确的。
现今,很多应用都可以做到有效地分析文本和条形码,因此到底哪个应用做的最好,还有待观察。
虽然这些功能在其他应用中已相当普遍,但Seeing AI显然更值得我们关注。因为Seeing AI让用户更加容易地在应用程序的摄像头中找到想要扫描的内容。在扫描条形码时,当用户太过接近条形码时,程序便会发出哔哔声,并引导用户将相机与文档边缘对齐。
另外,“人与场景”的互动是这类应用更为有趣的地方。实践发现,除了文本和条形码,Seeing AI还能够借助大量的微软人工智能算法来识别周围的物体和人物。这是微软早期演示版本中最令人印象深刻的地方,但是在外媒人员的另一测试过程中却并非全面好评。
初始,他们仅放置了一张桌子和一个沙发,Seeing AI很容易地便识别出来。然而,接下来的试验却不尽人意。Seeing AI将一些书籍误认为是一堆传单,将顶部有一些游戏设备的迷你冰箱误以为“楼层,室内,桌子”。因此如果真想弄清楚面前是什么,它似乎还未起到太大的帮助。
除以上之外,Seeing AI不仅可以识别周围的人数,还能根据面部表情来估计他们的年龄和情绪状态。
自从第一次问世以来,微软似乎已经改善了它的年龄猜测技术,但它仍然还有一些工作要做。虽然年龄预估相当接近,但表情检测似乎还不太靠谱,而且它还无法检测那些没有直视相机的人,这似乎是一个相当严重的“短板”。
当然,这些并非完全出乎我们的意料。像这样的应用程序,需要通过大量的数据训练和算法调整,才能接近真实可靠的程度。不过,如果它确实能使视障人士更轻松地浏览周遭环境,那么肯定会有极高的市场价值。