AI识别技术发展到了哪一步?海马扫描试用评测
深度学习的突破带来了人工智能技术的再次繁荣,它也不仅仅只是高高在上的技术理论。深入生产生活,成为这届人工智能技术的主要命题。
如今,不论是与大国崛起息息相关的智能制造,还是与居民密不可分的衣食住行、学习办公,都乘着人工智能东风蜕变升级,今天,小编试用了一款由好未来推出的 “海马扫描”――支持PDF、PNG、JPG等文件的文字识别、公示识别和智能排版的工具型产品。
那么,大家不禁要问,市面上具备 OCR文字识别等技术的产品种类繁多,甚至手机原生相机都搭载类似的技术功能, “海马扫描”有哪些不一样?它的核心功能是什么?到底有没有解决用户痛点? 我们一探究竟。
海马扫描的操作体验简单,界面功能明晰,需要手机验证登录,从而实现 PC 客户端和微信小程序的联动使用,从体验来看,还是 PC 版本的海马扫描功能更加丰富。
进入海马扫描客户端,我们可以看到导航页面,可以选择导入印刷体或者英文的手写电子稿,也可以从网站或电脑文件中选取截图。
小编选择网站截图录入,识别完成用时不到 10 秒,体验不错。据了解,现在教师在备课、考试、作业等多个业务场景下,均需要将纸质材料电子化,但传统的纯人工键盘录入的方式仍然存在很多缺陷。
首先,纯人工录入试卷的形式耗时耗力,且因为工作量大占用时间导致老师的主动性差;其次,偏远地区教师、年龄偏大的教师、以及对电脑不熟悉的教师打字速度慢,纯人工录入操作难度较大,录入一套试卷耗费大量时间,占用了老师的教研精力;其三,寻找其他专业人力来录入试卷试题,虽然节省了老师的时间和精力,但将本校的资源交于他人录入一来涉及内容保密,二来耗费物资。
所以通过 OCR文字识别等技术就可以解决教研方面的这一痛点问题。当然,在更多的轻办公场景下,解决白领们的文稿整理问题,OCR文字识别更是已经流行开来。
这是基于 OCR文字识别和自然语言识别技术的编辑功能,可以实现:文本可编辑、抠图可编辑、表格可编辑等功能。
同时,页面展示区自带右旋转 90度、左旋90度、查看上一页、查看下一页和删除功能,方便文件的微调、查看和删减。 此外, 图像区域自带 了 缩小、放大和收起三大功能按钮 , 可以满足文字校对与替换,文字编辑与撤销等需求 。
据了解,在教学场景中,教师只需要导入试卷,就可以一键转换成文本并排版,最后将试卷中的试题内容、答案解析均拆分并入库。这些被拆分好的试题进入试题库后可以用于日后的教学、在线考试、工作等多个应用场景。
在功能性方面,海马扫描具备了重新识别、截图识别、公式识别、绘制区域、文本校对等更为具体的操作指令,方便个性化的使用。
从工具栏功能键来看,公式识别主要实现 了 对图像区域内的公式进行截图和识别 , 通过公式截取与识别,形成 LaTex代码,再通过LaTex代码的复制和在文本区的粘贴,再度转换为公式,从而实现由图像到文本的转换。
公式识别功能在实际使用的过程中,可以根据场景需求,替换或者批改扫描文件中出现的公式,海马扫描还建有公式面板方便操作。
在成功识别公式之后,你可以得到一组 Latex数学代码,这样一来就解决了老师们试卷出题和整理、批改作业等等一系列涉及到公式的电子化应用难题。
此前, 在试卷的录入过程中,尤其是数学试卷的录入,经常会遇到文字、数字、图形以及数学公式的混合录入。其中,又以数学公式录入比较棘手。 如果 翻译成 “文字+LaTex代码”,并经剪贴复制、粘贴以及LaTex等步骤处理后, 可以 快速完成试卷的录入 ,目前支持的公式为初中以下。
上图则是微信小程序的使用结果,在登录之后,可以实现常用的拍照扫描、导入照片扫描、聊天记录扫描等功能,基于移动端的用户需求,而且不需要下载新的 APP ,便捷的操作和稳定的识别还是值得点赞的。
随着人工智能技术的不断下沉和普及,各行各业都将受益。从一个小的切口进入,都可能发现一个巨大的需求市场,解决长期以来用户面临的痛点问题。基于 OCR 的人工智能识别技术就是这样,用过,一定就离不开了。(易智)