你来自哪里?这个AI技术能根据英文笔迹就能判断
(原标题:AI could read your handwriting to figure out your nationality)
网易科技讯 7月5日消息,据国外媒体Fast Company报道,借助一项机器学习算法,研究人员能够分析一个人的手写英文文本,进而判断书写者是否来自五个不同的国家中的一个:马来西亚、伊朗、中国、印度和孟加拉国。
研究人员创建了一个来自这些国家的100人的数据集,让他们用英语书写,总共写了500行。对于这些手写字,一种名为Cloud of Line Distribution(简称COLD)的工具可以对一个个的字母进行分析,估量字迹的直线度或弯曲度。该算法在判断书写者的国籍方面比现有的方法更加出色,对一些国家的预测准确性甚至高出了一倍多。
该算法所做的正是机器学习技术最擅长的事情:发现模式。例如,当来自中国的书写者使用罗马字母时,他们会用更直的线条来书写字母,因为汉字通常是用直的笔画组合而成的。另一方面,来自印度和孟加拉国的书写者所写的字母则相对弯曲,因为他们国家的字体大多数都是弯曲的,形状比较圆。
识别笔迹是计算机视觉研究人员最先处理的任务之一。之前的研究试图辨别书写者的情感,判断其性别和年龄,但除此之外,并没有多少研究是试图从笔迹中梳理出更多的信息,这可能是因为没有人找到将这种技术变现的办法。
来自印度、中国和马来西亚的研究人员认为,这项技术会有助于犯罪调查。警方越来越多地借助生物识别技术来处理犯罪问题,从笔迹中提取有用信息或许可以给人脸识别软件等其它的技术带来补充。
但是,他们没有解决这类技术和类似技术应用可能会带来的隐私或民权问题。例如,放大训练数据库原有的偏见的错误,可能会使得刑事调查牵连到无辜的人。又或者,企业可以利用笔迹识别软件,来根据某人的国籍、甚至智力等特征歧视潜在的客户。
然而,在执法部门考虑使用它之前,研究人员必须扩张他们所使用的小型数据集,来证明COLD不仅仅是一个有趣的项目。(乐邦)