1. DeepSeek V4 预览版发布,挑战美国 LLM 龙头地位
中国 DeepSeek 于 4 月 24 日发布备受期待的 V4 模型预览版,主打更低的推理成本和更强的智能体(agent)能力。基准测试显示其性能紧逼美国头部模型,但价格大幅压低。CNBC 评论称这是中美 AI 竞赛进一步白热化的信号,开源生态再添重量级玩家。
2026年04月29日 · windyviews.com
中国 DeepSeek 于 4 月 24 日发布备受期待的 V4 模型预览版,主打更低的推理成本和更强的智能体(agent)能力。基准测试显示其性能紧逼美国头部模型,但价格大幅压低。CNBC 评论称这是中美 AI 竞赛进一步白热化的信号,开源生态再添重量级玩家。
OpenAI 推出 GPT-5.5,将 ChatGPT、编程工具和浏览器能力整合到单一界面,并把 Custom GPTs 重塑为可在 Slack 与 Salesforce 中运行的共享智能体。这是 OpenAI 向"AI 超级应用"战略迈出的关键一步,企业入口进一步集中。
4 月 28 日布鲁塞尔,欧盟谈判代表完成 Digital Omnibus on AI 的最后一轮政治三方会议,废除了原先的有条件延期,改为硬性截止日期:独立高风险系统须在 2027 年 12 月 2 日前合规,嵌入受监管产品中的高风险 AI 则要求 2028 年 8 月 2 日前到位。欧盟正式告别 AI 监管"软着陆"。
研究人员公布了一种结合神经网络与人类式符号推理的新方法,号称能将 AI 能耗削减最多 100 倍,同时还能提升精度。在 AI 数据中心电力压力激增、2026 年总投入预期突破 6000 亿美元的当下,这一突破为大模型可持续运行提供了新方向。
Sony AI 宣布 Project Ace 成为首个在真实世界中达到精英及专业级人类水平的乒乓球自主系统,也是机器人首次在常见竞技体育项目中达到专家级。该成果对实体 AI、实时感知与精细运动控制具有里程碑意义。
Avoca 宣布完成超过 1.25 亿美元融资,估值迈入 10 亿美元独角兽行列。其产品面向暖通、水管、汽修、搬家等现场服务行业,提供 AI 语音和工作流智能体。这显示 AI 应用正快速向"非科技"蓝领行业渗透,落地变现路径越走越实。
4 月 ICLR 一篇论文发现,通过强化学习训练模型获得更强推理能力时,"工具幻觉"率会与任务表现同步上升。OutSystems《2026 AI 开发现状》调查显示 96% 的企业已经在运行 AI 智能体,这意味着幻觉问题正从研究话题变成实际部署风险。
OpenAI 在硬件战略上做出重大转变,将 GPT-5.3-Codex-Spark 部署在 Cerebras 晶圆级芯片上,而非传统的 NVIDIA GPU。该平台主打更高吞吐量与低延迟,意在缓解 Codex 类编程模型的算力瓶颈,也释放出 AI 推理硬件多元化的明确信号。
本期主线是"算力—成本—监管"三股力量同时收紧:DeepSeek V4 与 OpenAI 上 Cerebras 都在压低单位推理成本,Avoca 的独角兽融资说明 AI 变现已经下沉到水管工和搬家工的工单里;与此同时,欧盟敲定 2027–2028 硬性合规日历,加上 ICLR 对强化学习放大幻觉的警告,提醒企业:能力涨得越快,治理债越重。