编程知识
  • 编程日记
当前位置: 首页 > news >正文

VikParuchuri/marker 学习简单总结

news 2025/9/2 1:17:21

核心代码

VikParuchuri/marker 的核心是使用https://github.com/VikParuchuri/surya的 pdf 模型,注意不仅仅是ocr,在marker的代码里面有标注ocr 是option的。强制OCR 要设置:OCR_ALL_PAGES=true

核心代码就是convert.py

def convert_single_pdf(fname: str,model_lst: List,max_pages: int = None,start_page: int 
查看全文

http://www.mrgr.cn/news/43357.html

相关文章:

  • STL06——手写一个简单版本的set
  • C++ 语言特性30 - 模板介绍
  • leetcode42:接雨水
  • 汇编DEBUG程序调用
  • [ESP32]ESP-IDF使用组件添加U8g2图形库
  • 3dsMax合并FBX的时候相同的节点会被合并(重命名解决),3Ds MAX创建空物体(虚拟对象或者点)
  • 一文秒懂鸿蒙Harmony-Next状态管理
  • 【AI知识点】正态分布(高斯分布)和中心极限定理(CLT)
  • InnoDB 中的索引页与数据行的关联详解
  • 封装el-upload组件,用于上传图片和视频
  • 镜头、diffuser、DOE
  • Leecode热题100-295.数据流中的中位数
  • U3D游戏开发之场景解锁小系统(UGUI版)
  • MySQL基础之约束
  • Android2024.2.1升级错误
  • 表达式求值(可以计算两位数以上)
  • 【云原生】云原生架构的反模式
  • dll动态库加载失败导致程序启动报错以及dll库加载失败的常见原因分析与总结
  • 今日指数项目个股描述功能实现
  • 弧形导轨驱动器高效使用技巧!
  • 最新文章

    • Class00.1:数据操作+数据预处理
      Class00.1:数据操作+数据预处理
      2025/6/25 16:37:02
    • 【4目方案】基于海思3403平台开发4目360°全景拼接相机方案
      【4目方案】基于海思3403平台开发4目360°全景拼接相机方案
      2025/6/25 12:45:55
    • Windows部署Sonic前后端(详细版)
      Windows部署Sonic前后端(详细版)
      2025/6/23 18:25:17
    • 仅测角系统跟踪MATLAB实现,在修正椭圆坐标系MSC下的稳定跟踪算法
      仅测角系统跟踪MATLAB实现,在修正椭圆坐标系MSC下的稳定跟踪算法
      2025/6/23 2:04:54
    • 推进可解释人工智能迈向类人智能讨论总结分享
      推进可解释人工智能迈向类人智能讨论总结分享
      2025/6/23 1:57:42
    • 一、什么是生成式人工智能
      一、什么是生成式人工智能
      2025/6/22 14:03:11
    • 编程知识介绍
    • 商务合作
    • 免责声明

    CopyRight © 编程知识版权所有