欢迎来到腾佑科技!欢迎来到腾佑科技!

文字识别助力智能运营,加速金融业务流转效率

扫码咨询
发布时间:2022-09-17 17:06:50 浏览: 0 评论 : 责任编辑: 创始人

智慧金融在金融服务的业务流程中不断深入,金融行业数字化建设的过程除了面向外部客户的服务与销售外,行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中,促使数据沉淀,加速流程效率,实现数字化建设闭环。

在智能运营覆盖的各个场景中,计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术(OCR)作为计算机视觉的主要方向之一,其识别对象包括扫描合同、印章、卡证、表格与票据信息结构化,在业务办理、风险控制、内部数据库建设与信息支撑等场景中都扮演着重要角色。

 

ocr应用


此图为智能运营中的 OCR 应用

在这些场景中,图片数据一方面通过对纸质文档和票据的扫描来获取,另一方面包含对证件拍照的方式获取。面临的场景难点和技术难点同时存在:

难点一:印章识别场景中的文字遮挡、模糊、弯曲程度高,印章类型多;

难点二:扫描文档文字密集,检测漏检与识别精度对后续关键信息提取系统影响大;

难点三:拍摄卡证图片时的透视变换、过曝过暗、有色阴影等问题;

难点四:表格种类繁多,差异性大,缺乏开源数据,无标注工具;

难点五:基于图像处理和规则的表格识别难度大,通用性差;

难点六:弯曲文本的端到端算法的精度问题与两阶段算法的速度问题需要权衡。


 

解决方案:

良好的算法模型是解决上述问题的首要因素,这不仅要求算法模型对于某个类型的对象的识别精度能够满足业务需求,还要其拥有良好的泛化能力。飞桨文字识别开发套件 PaddleOCR 针对自然场景下的 OCR 任务提供面向产业级的超轻量通用 OCR 系统 PP-OCRv3,经过海量数据训练,达到产业级 SOTA,在工业制造、交通等行业中得到广泛验证。针对文档场景提供智能文档分析系统 PP-Structurev2,实现表格识别、关键信息提取、版面分析与恢复任务。

 

 

场景应用:

▎场景1:印章弯曲文本检测与识别

印章检测识别是定位合同文件和常用票据中印章位置,提取识别印章内容的任务。可以用于检测合同文件和票据中是否有印章,对比印章内容,验证是否有业务风险。实际业务中通过人工审核对比的方式成本高,效率低。为了降本增效,提高生产效率,基于 PaddleDetection 和 PaddleOCR 开发套件,实现印章检测以及印章文字识别任务,代替人工识别,降低成本,辅助印章比对验证业务,提高验证效率,降低财税及商务合同签订过程的业务风险。

 

印章文本


▎场景2:扫描版合同关键信息抽取

合同审核广泛应用于大中型企业、上市公司、证券、基金公司中,是规避风险的重要任务。实际业务中人工进行纸质版合同审核成本高,工作量大。针对以上场景 PaddleOCR+PaddleNLP 可以快速提取文本内容,经过少量数据微调即可准确抽取关键信息,高效完成合同内容对比、合规性检查、风险点识别等任务,提高效率,降低风险。

 

扫描合同


 

▎场景3:通用卡证结构化信息提取

卡证识别的应用遍布于银行、保险、证券、信托等各种金融机构,在业务办理和信息核验场景中需要识别身份证、银行卡、驾驶证、营业执照等。由于数据的采集来源多样,存在各种噪声,如图片方向混乱、反光、模糊、倾斜问题的干扰,且一般需要对卡证信息进行结构化输出。针对上述问题,基于 PaddleClas 与 PaddleOCR 完成卡证方向与类型分类,多方案卡证检测对比与识别,最终 H-Means 达到93%以上。

 

卡证结构


 

▎场景4:中文表格识别与属性分析

中文表格识别在保险理赔、财报分析和信息录入等场景应用颇多,实际业务中人工进行录入成本高,同时,开源中文表格数据集少也限制了中文表格识别模型的发展。针对以上情况,通过采用数据标注、数据合成和微调等场景适配方法,同时结合表格属性识别,快速完成中文表格识别任务。

表格



热门活动

  • 条形码ocr识别api可检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR等9类),且自动返回存储的内容。...

    2023-03-07
  • 百度OCR增值税发票识别服务,已支持普票、专票、卷票、区块链发票、全电发票(即新版全国统一电子发票,专票/普票)的所有关键字段识别,“加料不加价”,单次调用低至0.017元;增值税发票验真服务,已覆盖全部12类增值税发票的信息核验,包括专票......

    2022-09-13
  • 水表度数识别OCR技术可以快速精准地识别水表读数,消除了人工读数的不确定性,提高了抄表的效率。...

    2023-03-06
  • 百度发票识别功能​能自动对增值税发票、增值税普票、电子发票、卷票等多种发票进行结构化字段识别提取,一招解决人工手动录入效率低、工作繁琐的问题。广泛应用于财税报销、发票验真、账单记录等场景。...

    2022-04-07
  • 百度智能写作平台是一款智能、高效、实用的内容创作工具。它既提高了内容创作的效率,也提升了内容质量,让用户可以更加轻松地创作出符合要求的高质量文案。...

    2023-03-07
  • 医疗检验报告单识别可用于在线问诊,用户上传各项检验报告单,自动识别提取关键字段信息,提升医生解读效率,为用户提供更加快捷、全面的个性化健康指导。...

    2022-03-28
  • 罗湖区党群服务中心致力于罗湖区级党建工作,发挥其示范作用,引领推动全区各级党群服务中心更好地发挥“凝聚党心、服务群众”的作用,为全区党建工作增添新的活力。...

    2022-06-01
  • 楼宇管理系统,智慧楼宇人脸识别系统 在诞生之初,人脸识别技术就受到人们的普遍关注,随着计算机、光学成像等相关技术的高速发展,人脸识别技术得到越来越多的应用,市场规模持续提升。 人脸识别技术是一门融合生物学、心理学和认知学等多学科、多技术(...

    2022-07-19
  • 智慧校园系统功能,人脸识别管理系统人脸识别是近几年在人工智能大浪潮下新兴起的一项科学技术,它主要通过分析比较人脸人脸特征信息进行身份鉴别,具有自然性、非强制性和非接触性等特点。同时,由于人脸识别利用的是人脸的独一无二特性,不易被复制...

    2022-07-18
  • 芜湖市彦思科技有限公司深耕水运物流行业20余年,基于对水运物流行业的深刻理解和资源积累,历时2年,耗资千万,对行业痛点进行了深度剖析,自主研发设计了“船舶管理智能终端”+“易航oTMS水运物流SaaS管理平台”的水运物流行业物联网管理解决方......

    2022-06-01

专题推荐

1