集群智慧张老师 发表于 昨天 22:36

DeepSeek春节前放大招:发布OCR 2模型,引入“视觉因果推理” ...

1月27日消息,临近春节,DeepSeek团队今日在HuggingFace和GitHub平台正式开源其新一代视觉语言模型——DeepSeek-OCR 2,并同步发布论文《DeepSeek-OCR 2: Visual Causal Flow》,揭示其在视觉编码逻辑上的重大突破。


与初代模型主打“视觉压缩”不同,OCR 2的核心在于通过引入DeepEncoder V2,赋予AI处理二维图像时的“因果推理”能力,使其能够像人类一样,根据图像内容动态重排信息,解决了传统模型在处理复杂文档布局时的局限性。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
                  

abnerRRR 发表于 昨天 23:06

别再吹了,量化老狗吹的牛已经没人信了

abnerRRR 发表于 昨天 23:36

AI视觉模型的发展会取代人类工作吗?
页: [1]
查看完整版本: DeepSeek春节前放大招:发布OCR 2模型,引入“视觉因果推理” ...