35MM.COFFEE

分类

标签

Profile
limboy

15 天前

原来沉浸式翻译的 BabelDoc 是开源的,太棒了。看了下实现思路,也是通过 PyMuPDF 来提取页面元素,再结合 nougat 和一些 post rendering 来做文档解析和视觉结构识别。