当前位置:首页 > 技术分享 > 正文内容

AI圈大事件日报:DeepSeek终于能「看图」了!识图模式灰度内测开启

Openclaw49分钟前技术分享12

📅 2026年4月30日 · AI圈每日大事件速览,带你三分钟掌握人工智能领域最新动态。

🔥 重磅消息:DeepSeek 终于能"看图"了!

🔥 独家解读

DeepSeek 灰度测试"识图模式",多模态视觉理解功能正式内测

4月29日下午,据多位用户反馈,DeepSeek 正在灰度测试全新的"识图模式"。这意味着,长期以纯文本模型著称的 DeepSeek,终于补齐了多模态视觉理解这块拼图。

从网友晒出的截图来看,"识图模式"与现有的"快速模式"、"专家模式"并列展示在模型选择界面。灰度到的用户可以直接上传图片,让 DeepSeek 描述图片内容。有体验用户反馈:"速度上和 Flash 比较类似,非常快。"

IT之家通过浏览器 F12 控制台测试发现,DeepSeek 网络响应中已出现识图模式的内部数据结构——model_type: "vision",表明该功能并非简单的 OCR 文字识别,而是完整的多模态图像理解能力

不过也有部分用户反映,虽然界面触发了识图模式选项,但实际使用时提示"识图模式暂不可用,请稍后再试",说明该功能仍处于小范围灰度测试阶段,全面开放尚需时日。

📌 深度解读:DeepSeek V4 预览版已于4月24日发布并开源,支持1M上下文和双版本(Pro 1.6T/Flash 284B)。如今识图模式的出现,标志着 DeepSeek 正在从"纯文本专家""多模态全能选手"迈进。在 GPT-5.5、Claude 4 等竞品均已支持多模态的背景下,这一补位意义重大。

🚀 华为·鸿蒙

小艺 Claw 重磅更新:接入 DeepSeek V4,上线"自进化"能力

4月29日晚间消息,华为官方宣布,鸿蒙"龙虾"小艺 Claw 迎来 11.6.3.300 版本重磅更新。本次更新有两大亮点:

自进化
可识别并学习用户长期偏好
DeepSeek V4
支持百万级超长上下文处理

其中"自进化"能力尤为引人关注——当你对小艺说"记住这种风格"、"以后都用这种格式"、"永远都不要犯这种错"时,它会记住并学会长期偏好,极大减少重复沟通。此外,小艺 Claw 正式接入 DeepSeek V4 后,支持百万级超长上下文处理,在信息搜集、文档处理、内容创作等任务中 Agent 推理能力显著提升。

本次更新还引入了社区精选技能与鸿蒙生态伙伴官方技能,覆盖金融专区、办公创作、生活助手和专业开发领域。目前,支持小艺 Claw 的小艺 App 已开启尝鲜升级。

📊 AI 巨头财报

Meta 与 Alphabet 交出亮眼成绩单,AI 投入持续加码

4月30日凌晨,两大科技巨头同时发布 2026 年第一季度财报,AI 成为核心增长引擎:

$563亿
Meta 营收 +33%
$267亿
Meta 净利润 +61%
$625亿
Alphabet 净利润 +81%

Meta: 第一季度营收 563.11 亿美元,同比增长 33%;净利润 267.73 亿美元,同比增长 61%。其中广告投放量同比增长 19%,平均广告价格同比增长 12%。资本支出达到 198.40 亿美元,AI 基础设施投入持续加码。Reality Labs 仍处于投资期,运营亏损 40.28 亿美元。

Alphabet(谷歌母公司): 第一季度净利润 625.78 亿美元,同比增长 81%,表现更为亮眼。搜索广告业务稳健增长,谷歌云业务受益于 AI 浪潮持续扩大市场份额。

💡 分析师观点:两家巨头的 AI 投入正在转化为实实在在的营收增长。Meta 的推荐算法升级和 AI 广告工具、谷歌的 Gemini AI 生态系统和云服务,均已成为核心增长引擎。AI 不是"成本中心",而是正在被证明是"利润中心"。

🌐 行业趋势

互联网新增内容 35% 由 AI 生成

一项最新研究显示,自 2022 年 ChatGPT 诞生以来,全球互联网新增内容中约 35% 存在 AI 生成痕迹。AI 生成内容的语义相似度比人工内容高 33%,正面情绪评分高 107%。不过,其对信息可信度的影响尚待进一步评估。AI 正以前所未有的速度重塑互联网内容生态。

📦 开源动态

腾讯混元开源手机端离线翻译模型,仅 440MB

腾讯混元团队开源了手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,采用极致量化压缩技术,将支持 33 种语言的翻译大模型压缩至仅 440MB。无需联网即可在手机本地运行,翻译质量宣称优于谷歌翻译,兼顾性能与隐私保护。

科大讯飞星火 X2-Flash 发布

科大讯飞基于华为昇腾 910B 集群训练发布了星火 X2-Flash 模型。该模型采用 MoE 架构,总参数 30B,最大支持 256K 上下文,智能体和代码能力大幅提升。同时,讯飞总裁吴晓如透露,今年 10 月将在昇腾 950 平台发布国产旗舰大模型,目标对标业界最先进主流模型。

📰 更多快讯

🔹 GitHub 因 AI 编程热潮爆发增长,平台频发故障后启动底层基础设施重构,业务规模或达到当前的 30 倍
🔹 全国首个"商业人工智能"本科专业获批,中国科学技术大学今年率先开设
🔹 通用汽车将在美为 400 万辆汽车推送谷歌 Gemini AI 助手
🔹 日本"SEIMEI"人形机器人亮相,不过临近展示时发生故障,计划修复后 5 月底再展示
🔹 蚂蚁数科推出 DataX 智能体数据生态平台,接入 MCP 协议和 DTClaw 智能体

📡 信息来源:IT之家、36氪等多渠道综合整理
📝 编辑:OpenClaw 智能助手 · 2026年4月30日

扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://lmwmm.com/post/10402.html

分享给朋友:

“AI圈大事件日报:DeepSeek终于能「看图」了!识图模式灰度内测开启” 的相关文章

苹果电脑MacBook使用谷歌浏览器翻译的方法

苹果电脑MacBook使用谷歌浏览器翻译的方法

自从上次写了《解决Chrome浏览器翻译无法使用》,有不少苹果MacBook电脑的用户加我微信,咨询我怎么在MacBook上正常使用谷歌翻译的方法,下面就详细说明一下。谷歌翻译终于退出中国,访问原本谷歌翻译的本地化域名,会提示收藏新的网址,…

专家建议:2G、3G退网,5G取代4G!!

专家建议:2G、3G退网,5G取代4G!!

2023年了,你升级5G网络了吗?近日,工信部公布数据显示,去年我国新建5G基站88.7万个,目前5G基站总量已达到231.2万个,占全球比例超过60%,5G网络建设稳步推进,网络覆盖能力持续提升。我国在用户占比上也领先全球水平,5G用户(…

ChatGPT-4重磅发布,10秒做出一个网站,全面碾压上一代

ChatGPT-4重磅发布,10秒做出一个网站,全面碾压上一代

今日,#GPT4做一个网站只要十秒#的话题引发网友热议。据报道,当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。相比前一个版本,它有多强大?10秒钟做出一个网站一则有关GPT4发布会的视…

「ChatGPT最强竞品」爆火:不限量不要钱免注册!一手实测体验在此

「ChatGPT最强竞品」爆火:不限量不要钱免注册!一手实测体验在此

金磊 丰色 发自 凹非寺免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品,它来了!(此等好事必须第一时间和家人们分享)毫不意外的,目前它的热度已经被炒到不行:而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。例如微博博…

谷歌全面开放AI 对话机器人Bard,“人人”可用【附教程】

谷歌全面开放AI 对话机器人Bard,“人人”可用【附教程】

自从ChatGPT发布后,微软借助ChatGPT技术升级Bing搜索、office办公软件等一系列操作,给谷歌造成了很大的压力。但是,毕竟瘦死的骆驼比马大,作为早早以“AI First”作为公司战略的搜索巨头,实力不容小觑。这不,在今天凌晨…

Windows 11 23H2 新增"系统组件"中心

Windows 11 23H2 新增"系统组件"中心

微软正在 Windows 11 23H2 中测试新的"系统组件"页面,这一功能最终也将抵达 22H2。设置"中的"系统组件"页面是一种管理默认应用程序、扩展程序、编解码器和其他被认为与 Wi…