达观OCR图像文字抽取算法平台满足业务场景快速定制

产品壹佰 • 3年前扫码分享

人工智能在当下已经不再是新潮的概念，在下一代技术跃进出现之前，业务场景的落地比让人眼花缭乱的技术名词更具备现实价值。对于大部分企业客户，业务部和技术部之间的相互依赖关系共同促进了技术在内部的使用，业务需求和技术能力相辅相成。OCR技术能够把光学文字转变为计算机字符，但对于文本和数据处理工作，将纸质文档上的数据通过人工智能技术变成计算机结构化数据，则能更有效地搭建知识桥梁，将人力从重复的人工录入转移到非重复的数据分析，产生更深层次的业务价值。

达观OCR平台基于机器学习和深度学习技术研发，在易用的前提下实现了高准确率的 数据抽取 ，助力企业各类单据的 高效录入 。

达观OCR平台基于领先的视觉技术、跨模态语义理解技术开发，利用海量的图像、文档训练出底层模型。进一步扩展业务定制能力，为企业提供强大的视觉基础模型以及一整套视觉任务定制与应用能力。包括基础模型训练、结构化识别训练、场景分类识别训练、版面分割识别训练等算法单元。

抽取模块

集成多种达观自研算法，以极低的学习成本，让非技术业务员快速上手，快速应用抽取功能，将单据录入工作简化为结果校对工作，数倍提高原有工作效率。

内置模型抽取；集成自研的标准化识别产品，包括多种小语种识别和数十种常见卡证抽取。
模版抽取-简单易用的模版标注；采用多种标注方式，支持锚点和无锚点标注，快速准确抓取目标信息。
模型抽取；应用最新多模态和集成算法，表现出高鲁棒性和良好的泛化性。
分类器识别；分类器作为一个平台功能的技术定义，在实际使用中对应我们的业务流场景，实现的功能是对打包或批量上传的单据数据完成自动分类抽取，并进一步定义审核校验等业务属性。通过定义分类规则或训练专研的分类器模型，关联对应抽取文档，构成一个分类器识别单元。常见的业务流诸如银行开户业务流、企业资质审查业务流等。

抽取结果展示

lQLPDhsNxmFXrKTNAibNA-iw2r6bcKMdYCAB5z31owBrAA_1000_550

lQLPDhsNxmTrNTrNAgLNA-iwqvLqdsb1gzAB5z379kBTAA_1000_514

lQLPDhsNxmkXUiHNAerNA-iwYGw3elhzZfcB5z4CtMBTAA_1000_490

基础模型模块

基础模型模块包括功能丰富的标注模块和底层OCR模型训练评估模块，满足底层模型的标注和训练需求。

lQLPDhsNxmyq2BTNAYTNAmuwcdU22_nWfQ4B5z4IJMBrAA_619_388

数据标注模块：支持文字标注和版面标签标注，通过机器预标注-人工修改的方式极大提高了标注效率，满足定制化场景的真实数据快速迭代。

数据生成模块：能够通过灵活定义版式、字符、内容等来实现生成数据扩展，以满足模型训练的数据需求。

OCR基础模型训练：支持检测、识别、版面分析等类型的模型训练功能，能够从标注或生成数据灵活切分，自由编排训练策略。底层基于达观自研算法调优，通过流程化配置完成底层模型的训练。

权限模块

权限模块设计了一套角色、用户、组结构的权限系统，满足灵活的权限配置和数据管理需求。

目前达观OCR平台已经赋能银行、券商、报关、制造业、电商等多个行业的头部客户，为其降低大规模抽取任务的定制门槛和抽取成本，节约企业人力资源，提高工作流效率，提升用户体验。

市场上的人工智能产品琳琅满目，我们希望产品的使用价值高于技术噱头，达观OCR平台从积累的无数客户场景和需求中孵化而出，以产生使用价值为驱动，助力企业搭建繁重纸质数据的数字化桥梁，走上降本增效的高速路。