文档智能分析产业实践,基于PP-StructureV2和OpenVINO实现训练部署开发全流程
创始人
2025-06-01 07:43:28
0

金融和医疗等行业存在大量书面文档结构化分析和内容提取场景和任务,例如合同、票据、卡证识别、纸质文本等电子化存储、文件复原与二次编辑、信息检索等。由于布局和格式的多样性和复杂性、低质量的扫描文档图像,自动、精准、快速的信息处理和提取对企业来说是一项具有挑战性的任务。 文档智能是指通过计算机进行自动阅读、理解以及分析商业文档的过程,是自然语言处理和计算机视觉交叉领域的一个重要研究方向。随着企业数字化转型进程不断加速,企业利用深度学习技术可以将非结构化的文档图片快速地转化为结构化的字符和图表,并基于Word或Excel形式进行保存,大大提高关键信息提取的效率,降低人力成本。

01 文档关键信息抽取与版面恢复实践

小伙伴肯定好奇,如何才能快速上手这么经典的深度学习产业应用呢?针对以上企业需求,飞桨开源了PP-StructureV2智能文档分析系统,支持版面分析、表格识别、关键信息抽取、版面复原等功能模块独立使用或灵活搭配。同时,飞桨也联合Intel建设了文档关键信息抽取与版面恢复产业实践范例,基于PP-StructureV2 Pipeline详解模型训练及调优经验以及如何基于Intel OpenVINO快速部署,优化CPU推理任务性能,极致利用Intel x86硬件资源。

项目链接

https://aistudio.baidu.com/aistudio/projectdetail/5666281?contributionType=1

场景难点

  • 书面文档中存在拍照、扫描、手写体等情况,识别难度大;
  • 文档版式多种多样,且版面元素大小不统一;
  • 基于CPU的AI算法部署成本高,嵌入式芯片的开发复杂度高,算法集成难。

方案设计

本次分享主要展示的是文档关键信息抽取和版面恢复任务。在该任务中,图像类的文档首先经过版面分析模型,被划分为文本、表格、图像等不同区域,随后对这些区域分别识别,如将表格区域送入表格识别模块进行结构化识别,将文本区域送入PaddleOCR进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的Word文件。

图片

PP-StructureV2 模型优化策略和效果

  • 版面分析任务中使用基于PP-PicoDet的轻量级版面分析模型,速度提升11倍,CPU上可实时推理。同时基于FGD知识蒸馏技术,在保证精度的情况下进一步压缩模型体积,预测速度比教师模型快1倍。
  • 表格识别任务中提出了 SLANet (Structure Location Alignment Network)网络结构,其中包含CPU友好型轻量级骨干网络PP-LCNet,实现更优的“精度-速度”均衡;轻量级高低层特征融合模块CSP-PAN,有效解决尺度变化较大等复杂场景中的模型预测问题结构,表格识别模型精度从0.97%提升至75.68%预测速度提升10% ;结构与位置信息对齐的特征解码模块SLAHead,将最终模型精度从75.68%提高至77.7%。

模型部署

  • 使用OpenVINO作为推理后端,倍数级提升任务在CPU侧的处理速度。
  • 基于OpenVINO的performance hint策略,根据使用场景的不同需求,自动完成多线程任务配置,优化模型吞吐量或推理延迟。

本项目的最终部署环境为Intel x86平台设备。考虑开发便捷性,本次示例使用Python部署开发环境。该系统是由版面分析、文本检测、文本识别、表格结构识别等4个模型所构建的Pipeline,可以实现文档图片的快速格式化功能。在飞桨人工智能学习与实训社区AI Studio中也提供了完整的使用示例与开发说明,可参考该教程快速学习,并针对实际项目进行开发和集成。

图片

为了让小伙伴们更便捷地应用范例教程,OpenVINO AI软件工程师Ethan将于3月23日(周四)20:15为大家深度解析从数据准备、方案设计到模型优化部署的开发全流程,并手把手教大家进行代码实践。

相关内容

热门资讯

发动消费引擎 释放内需潜力 来源:中国金融信息网 消费是经济增长的“主引擎”,也是民生幸福的“晴雨表”。回顾2025年,中央及地...
重磅反转!传字节跳动2026年... 字节跳动被传2026年拟投400亿元,大量启用华为昇腾芯片 此前我们曾报道豪掷1600亿!字节跳动...
紫光国微、宁德时代等在北京成立... 天眼查App显示,近日,紫光同芯微电子科技(北京)有限公司成立,法定代表人为陈杰,注册资本3亿人民币...
张一鸣再出爆款!消息称豆包日活... (图片来源:摄图网) 据36氪报道,字节跳动旗下AI应用豆包的日均活跃用户数(DAU)已正式突破1亿...
管涛:“灵活高效”的货币政策意... 管涛 | 立方大家谈专栏作者 继去年底时隔14年重提“实施适度宽松的货币政策”后,今年底中央经济工作...
小米“二号人物”拟减持不超20... 来源:界面新闻 12月28日晚间,小米集团在港交所发布公告称,公司联合创始人、执行董事、副董事长林斌...
如何实施更加积极的财政政策?2... 央视网消息:12月27日至28日,全国财政工作会议在北京召开。记者从会议上了解到,2025年,我国积...
中期协最新发布!@期货公司,新... 来源:证券时报 12月26日,中国期货业协会(下称“中期协”)发布通知,就《期货公司接入外部信息系统...
长期冒充“中国书法家协会主席”... 近日,“平安泰州”微信公众号发布一则消息,书法爱好者周大爷“莫名其妙”地收到来自 “中国书法家协会”...
山海:切勿跟风黄金市场,保持自... 山海:切勿跟风黄金市场,保持自己的专属节奏! 现在刷遍网络,大家都看到了,贵金属这轮的上涨已经是资...
小红书博主为免单白嫖发“避雷帖... 近日,丽江古城喊话小红书审核“避雷帖”的内容引发关注。 红星资本局注意到,在小红书平台上,“避雷”和...
时间为友,共赴红利之约:六个维... 若时间是尺,红利便是能衡量其价值的那把。 在追逐价格的二级市场里,红利也是少数能让时间“显形”的品种...
串通报价、操纵市场,多家电力巨... 来源:企业观察报 2025年,是新一轮电力体制改革实施十周年的关键节点,也是全国统一电力市场计划初...
原创 美... 中国实施稀土出口管制政策,是为了阻碍美国建立自己的稀土加工产业吗?到底是“菜是原罪”还是中国阻挠的原...
杨伟民:预计“十五五”时期中国... 杨伟民认为,在“十五五”时期,特别是在“十五五”前期,宏观调控必须把推动价格回升作为重要目标 文|《...
硅谷宠物情感智能公司Train... 文|富充 编辑|苏建勋 硅谷宠物情感智能公司Traini宣布已完成超5000万元人民币融资,资金将主...
为了贴上“美国制造”,敏华宁愿... 出品I下海fallsea 胡不知 2025年12月,一则不起眼的收购公告,在家居圈掀起了不小的波澜...
12月29日投资避雷针:五公司... 导读:财联社12月29日投资避雷针,近日,A股及海外市场潜在风险事件如下。国内经济信息方面包括:1)...
一财社论:以有效产能出清解决行... 提高经济运行质量已到了亟须优化发力路径的关键阶段。 国家统计局数据显示,前11个月,全国规上工业企业...
逆天价入市的杭州新盘被市场看空 界面新闻记者 | 杨冰柯 界面新闻编辑 | 庄键 杭州楼市下行之际,拿地近12年的杭州英蓝中心以...