首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
Qianfan-OCR
Qianfan-OCR 是百度千帆推出的端到端文档智能模型,基于 4B 参数视觉语言架构,将文档解析、版面分析、文字识别与语义理解融为一体。模型在 OmniDocBench v1.5 评测中以 93....
查看更多
diamondss
03-23
LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 是开源的多模态模型,通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置编码和区域感知注意力...
查看更多
渔亦声
10-16
MonkeyOCR
MonkeyOCR 是一个用于文档解析OCR的项目,采用结构 - 识别 - 关系三元组范式。它支持英文和中文文档解析。能处理 PDF 和图像文件,输出多种格式结果。还可通过特定方式更新配置文件以使用不...
查看更多
Lauren Phillips
07-07
Bob
Bob 是一款 macOS 平台的翻译和 OCR 软件,您可以在任何应用程序中使用 Bob 进行翻译和 OCR,即用即走,简单、快捷、高效!...
查看更多
小千绪
06-23