基于:原理到实战的表结构技术精讲
随着各类文档的爆发式增长,文档智能领域的研究蓬勃发展。 其中,表格是各种文档中常见的页面元素。 如何高效地从文档中查找表格并获取内容和结构信息,即表格识别,是文档智能的一个重要领域。 本课程是关于文档智能领域的一个分支:表结构识别。 这里不得不说的是一个非常流行的开源项目(Star达到25.1k),它的一个分支是这个开源项目的一大亮点,用于解决文档智能(布局分析、布局还原、表格结构) 、信息抽取等)领域问题。本课程也是基于开源项目,从背景到难点,从传统方法到深度学习,从数据到训练,从模型理论到实战,全面讲解表结构识别技术:1)算法模型:重点讲解LGPMA(海康威视)、(平安产险)、-RARE()、()模型; 2)语料库建设:提供开源数据、标注工具()、自动生成工具()三维语料库建设方法3)项目实战:讲解表格识别的关键源码,并实现项目环境安装,准备你的全程拥有数据集、修改配置文件、模型训练与评估、模型导出环节