综合机器之心与各大开发者平台资讯,国内人工智能独角兽企业云知声今日召开发布会,正式宣布其核心的光学字符识别(OCR)产品线——U1-OCR架构实现重大升级,并面向全网开发者同步开放了全新API接口。这一举动标志着行业正式迈入以大模型驱动的“OCR 3.0”时代。
与传统OCR模型受限于版式固定、面对复杂排版容易出现关键信息截断等缺陷不同,升级后的U1-OCR底层深度融合了多模态大模型的语义理解能力。它不仅能实现对极其复杂的嵌套表格、潦草手写体、多语种混合等极端业务场景的精准提取,更能直接“读懂”文本背后的财税、法律逻辑关系。
更具行业冲击力的是,在商业模式方面,云知声宣布U1-OCR将全面放弃传统的“按调用次数(按次)计费”的陈旧模式,转而采用与当代大语言模型完全接轨的“按Token计费”模式。此举大幅降低了中长尾开发者的使用门槛,让多模态数据解析成本变得更为透明。

