让每个普通人都有一个效率助手 夸克扫描王用技术创新提升用户体验
8月24日,在夸克举办的“Meet AI”开放日中,夸克扫描王展示了离线扫描、魔法擦除以及公式提取等场景中的技术能力,夸克自研的AI视觉技术已经开始应用到每个人的日常生活中,帮助他们解决实际问题。
手机 上网已经成为人们日常生活的一部分,但是在高铁、图书馆等网络信号不稳定时,很多扫描产品的体验并不好,因为手机硬件的算力和服务端的算力相差百倍,这也是很多手机扫描产品面临的技术难点。
为了不让网络环境影响扫描体验,夸克开发了独有的离线扫描模式,用户无需网络就能完成高质量扫描。为了实现该功能,夸克进行了很多技术创新,也是第一个将扫描AI算法上端的产品。从结果来看,通过模型量化和压缩等技术,模型的size缩小了100倍,结合传统算法后扫描效果保持95%,计算耗时仅为2秒。
数据显示,目前夸克用户中25岁以下的占比超过一半,他们很多人都是在校大学生,对扫描书本、提取文字和公式有着强烈需求。
其中,提取公式需要在OCR领域进行更有突破性的技术创新,夸克首次将多模算法引入文字识别领域,让公式识别、手写识别的效果得到了大幅度提升,在夸克用户的高频场景上,印刷文字识别精度99.99%,手写文字识别精度 98.5%+。
夸克扫描王在提取公式、表格还原、扫描手写体等方面已经达到行业领先水平,可以很好地满足大学生群体在学习场景中的需求。
在日常生活中,很多年轻人都喜欢编辑照片。夸克扫描王依托强大的算法能力,不仅能修复图片中的缺陷,还能给用户提供更具创意的想象空间。
例如,为了让擦除的效果更好,机器就要有能力识别出擦除后的图片背景并进行还原,它的难点在于不能够提前预判背景样式,也没有清晰的数据标注。在这个过程中,夸克使用判别器进行识别,模拟“学生”给“老师”交作业的情景,通过反复的训练,不断精进学生的作品以及老师的审美水平,最终呈现出一张效果优质的图片。
在这个过程中,夸克使用了数千万张的高质量智能图像,同时使用上百个GPU,持续训练一周。而用户只需要简单地涂抹便可完成照片美化。
夸克视觉技术负责人黄锐华表示,夸克扫描王会不断完善技术能力,加强在学习、工作、生活等场景中的创新体验。面向未来我们也有信心给用户提供不同类型的产品,让他们享受更有效率的数字生活。