V
主页
Pix2Text V1.1+:支持 PDF 转 Markdown,并带来更好的数学公式识别能力
发布人
Pix2Text (P2T) 是 Mathpix 的开源免费替代工具,支持将图片转换成可编辑的文本表示,支持80多种语言。可识别 PDF 或图像中的复杂版面、表格、数学公式和文本,并将它们合并转换为 Markdown 格式。最近刚发布了新版 V1.1.1,带来了更好的数学公式检测模型(MFD)。 具体说明参考:https://www.breezedeus.com/article/p2t-v1.1 和 https://www.breezedeus.com/article/p2t-mfd-v1.1.1 。 - 更多说明:https://www.breezedeus.com/article/pix2text_cn - Github: https://github.com/breezedeus/Pix2Text - 免费在线服务: https://p2t.breezedeus.com - Huggingface Demo: https://huggingface.co/spaces/breezedeus/Pix2Text-Demo (国内镜像: https://hf.qhduan.com/spaces/breezedeus/Pix2Text-Demo )
打开封面
下载高清视频
观看高清视频
视频下载器
Pix2Text: 替代 Mathpix 的免费 Python 开源工具
Pix2Text 新版和网页版发布,离Mathpix又近了一大步
最新语音识别技术简介(Introduction to ASR)
标注工具Label Studio如何导入本地文件和模型预测结果
UI Agent 论文分享:来自华为诺亚方舟实验室的 LiMAC
CnOCR 纯数字识别新模型
文本检测和识别——附CnStd与CnOcr工具介绍
UI Agents(智能体)技术
如何做调研
Finetune之后的NLP新范式:Prompt方法综述
CnOCR V2.3 新版发布,模型精度更高,数量更多
主动学习:如何合理使用样本先验信息
self-supervised & contrastive learning
UI Agent 论文分享:来自 LG AI Research 的 Auto-Intent
基于⼤语⾔模型的 AI Agents—Part 1
更精准的硬币识别:硬币多模态模型 Coin-CLIP
NLP中的自监督学习和对比学习
基于⼤语⾔模型的 AI Agents—Part 2
超参调优框架简介
antiOCR 工具使用介绍
声纹分割聚类(Speaker Diarization)
开放域聊天机器人技术介绍
如何安装CnOCR,以及免安装直接使用CnOCR
NLP论文阅读:最新对比学习方法 SimCSE
文本摘要(Text Summarization)技术简介
详解 Llama 3.1 是怎么炼成的
视觉-语言预训练(VLP)技术介绍
论文分享:ACL2020 Best Paper-Beyond Accuracy: Behavioral Testing of NLP Models with .
基于⼤语⾔模型的 AI Agents—Part 3
NAACL 2022 Tutorial on Contrastive Data and Learning for Natural Language Proces
RS论文阅读:你真的读懂了Youtube DNN推荐论文吗?
比LLM更重要的多模态学习(Part2)
7-无监督模型:K-Means、DBSCAN、PCA
NLP中的各种不正确使用方法(反面模式:Anti-Pattern)
6-树模型和融合模型
cnocr 使用场景
如何让任务型聊天机器人更加鲁棒
5-kNN模型与距离度量
The Next Generation of Neural Networks, Geoffrey Hinton
【台大李宏毅】AACL-IJCNLP 2022 Tutorial_ Recent Advances in Pre-trained Language Models