孚临科技申请LLM驱动的复杂报表OCR错误自校正方法及系统专利,实现了复杂报表中字段的智能纠错与结构化重建

金融界2025年8月4日消息,国家知识产权局信息显示,浙江孚临科技有限公司申请一项名为“LLM驱动的复杂报表OCR错误自校正方法及系统”的专利,公开号CN120412000A,申请日期为2025年07月。

专利摘要显示,本发明公开了LLM驱动的复杂报表OCR错误自校正方法及系统,包括如下步骤:S1、获取复杂报表图像数据,执行OCR处理,构建原始字段数据集;S2、提取上下文信息,识别语义矛盾字段,生成待校正字段集合;S3、指针生成网络生成多个字段修正候选,形成候选字段集合;S4、构建多臂老虎机模型,选择最优字段修正结果,形成修正字段输出集合;S5、执行版式分析,提取图表标题字段、图例字段与数据区域文本;S6、图表结构语义一致性机制,生成图表标题字段的修正字段结果;S7、字段还原与版式重建,输出结构化报表数据。本发明通过融合大语言模型、指针生成网络与多臂老虎机机制,实现了复杂报表中字段的智能纠错与结构化重建。

天眼查资料显示,浙江孚临科技有限公司,成立于2017年,位于杭州市,是一家以从事互联网和相关服务为主的企业。企业注册资本5500万人民币。通过天眼查大数据分析,浙江孚临科技有限公司共对外投资了7家企业,参与招投标项目24次,财产线索方面有商标信息10条,专利信息43条,此外企业还拥有行政许可8个。

本文源自金融界

展开阅读全文

更新时间:2025-08-06

标签:科技   报表   字段   错误   专利   智能   方法   系统   科技有限公司   浙江   图表   数据   天眼   语义   企业   信息

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top