供应商登录

采购商登录

中文站 English Français Русский Español العربية Português Deutsch

矿产与冶炼

建筑与建材

首页产品供应商培训央企在世界海外招标全球简讯全球通讯录

首页全球简讯详情

Mistral推出OCR API 将PDF转换为AI友好的Markdown文件

2025-03-07 11:16

法国大型语言模型(LLM)开发商Mistral近日推出了一款新的API——Mistral OCR，旨在帮助开发人员处理复杂的PDF文档。该API通过光学字符识别(OCR)技术，将PDF文件转换为文本文件，并以Markdown格式输出，便于AI模型摄取和处理。

与大多数OCR API不同，Mistral OCR是一款多模态API，能够检测PDF中的插图和照片，并在输出中为这些图形元素创建边界框。此外，Mistral OCR的输出采用Markdown格式，这是一种开发人员常用的格式语法，用于向纯文本文件添加链接、标题和其他格式元素。

Mistral联合创始人兼首席科学官Guillaume Lample表示：“多年来，组织积累了大量的PDF或幻灯片格式文档，这些文档通常无法被LLM(尤其是RAG系统)访问。通过Mistral OCR，我们的客户现在可以将复杂文档转换为所有语言的可读内容。这是在需要简化对其大量内部文档访问的公司中广泛采用AI助手的关键一步。”

Mistral OCR可在Mistral的API平台上使用，也支持通过AWS、Azure、Google Cloud Vertex等云合作伙伴访问。对于处理机密或敏感数据的公司，Mistral还提供本地部署选项。

据Mistral称，其OCR API在性能上优于Google、Microsoft和OpenAI的同类产品。该API已通过包含数学表达式(LaTeX格式)、高级布局和表格的复杂文档测试，并在处理非英文文档时表现更佳。此外，由于Mistral OCR专注于单一功能，其处理速度也优于多模态LLM(如GPT-4o)。

Mistral还将Mistral OCR用于其AI助手Le Chat。当用户上传PDF文件时，Le Chat会在后台使用Mistral OCR解析文档内容，然后再进行文本处理。

开发人员和企业可以将Mistral OCR与检索增强生成(RAG)系统结合使用，将多模态文档作为LLM的输入。例如，律师事务所可以利用该技术快速浏览大量法律文档。

北美洲美国信息通信

Mistral / OCR / API

本简讯来自全球互联网及战略合作伙伴信息的编译与转载，仅为读者提供交流，有侵权或其它问题请及时告之，本站将予以修改或删除。邮箱：news@wedoany.com

“位至”人员管理

工业企业安全分险动态管控系统

智慧巡检管理系统

特殊作业许可全过程管理系统

危化品仓储安全生产管理系统

外来访客预约定位系统

企业安全生产全流程管控系统

人民线缆国标足米RV10平方单芯多股软电线国标铜线电子线

人民线缆国标足米RV6平方单芯多股软电线国标铜线电子线

人民线缆国标足米保检测RV4平方多股软电线纯铜线电子信号线

铜芯聚氯乙烯绝缘聚氯乙烯护套金属屏蔽软电缆

豪华户外锁

标准锁/大把钥匙

豪华按钮锁/豪华锁

过滤器+风机

全球简讯

西核设备承制的徐大堡1号机组“双热交换器”实现高质量交付漳州3/4堆芯探测器项目启动会顺利召开生态环境部（国家核安全局）与中核集团召开核安全监管年度对话会中核五公司签订广西白龙核电厂2号机组核岛安装和常规岛及其BOP建安工程施工合同巴西1月份石油产量下降 2%，天然气产量上升中乌签署两项农产品输华议定书萨莫拉和萨拉曼卡为40个市镇招标1.2 兆瓦光伏项目，投资额为160 万美元全国秋粮累计收购超3亿吨德国深水区锂资源储量高达2651万吨约翰迪尔推出新一代联合收割机前端设备天合光能为西班牙 22MW Valcasado 项目提供智能太阳能解决方案利用森林废弃物提供能源的储能系统经过 10,000 次循环后仍保留 60% 的容量 Fortress Power 推出 9.6 kWh 可堆叠家用电池康宁、Suniva、Heliene 将生产首批完全美国制造的太阳能电池组件由于粮食价格上涨，俄罗斯养猪成本上升 GUVNL 以每千瓦时 2.60 印度卢比的价格分配 250 兆瓦太阳能俄罗斯Miratorg公司将在图拉附近建造价值10亿卢布马铃薯仓储设施特斯拉Cybertruck销量不佳，推出折扣融资促销杜克能源佛罗里达公司计划建设四个新的太阳能发电场 BP调整战略：削减绿色项目支出，增加油气产量