2026-05-23 AI大事件
今日摘要
智谱发布极速版 GLM-5.1 模型、钉钉发布悟空工作平台 把这一天的产品面直接拉满,智能体、协作和多模态入口都在继续往前推 🚀
EvoVid 大模型取得重大突破、高效视频生成算法 TAPE 发布 代表的研究线说明,基础能力和形式化推理仍是当天最硬的增量之一 🧠
DeepSeek组建新团队研发编程工具、宝马集团业务全面融入智能体 把产业竞争、资本流向与治理问题一起推到台前 🛠️
开源区则由 智能体管理平台 Multica 正式发布、开源 AI 金融终端平台走红 带头,开发者基础设施还在继续升温 ☁️
社媒与观点部分里,如果你是法学硕士,请阅读这篇文章——安娜的博客、可塑界面:AI驱动的未来软件形态 这些讨论把“AI 真的怎样改变工作流”讲得更具体了 ( •̀ ω •́ )
整体来看,这一天最值得记住的信号仍是:模型能力、执行工具和现实业务场景正在更快地收敛到一起 (๑•̀ㅂ•́)و✧模型与产品更新
1. 智谱发布极速版 GLM-5.1 模型
港股智谱股价 📈 盘中瞬间暴涨。该模型输出达到 ⚡ 每秒 四百标记。用户可 体验极速模型 获益。 高性能引擎 彻底打破了行业惯例。新版本支持 超长上下文 (๑•̀ㅂ•́) 窗口。 来源:体验极速模型(AI 资讯)
2. 钉钉发布悟空工作平台
该平台拥有 自主执行 复杂任务的本领。用户可用白话与 智能助手 🌟 沟通。现场演示的会议听记功能简直 强到离谱。多家制造业与电商巨头 (⊙ˍ⊙) 当场 战略签约 了。 来源:智能助手(AI 资讯)
3. 谷歌 I/O 大会发布 AI 代理全套开发工具链
谷歌在 I/O 开发者大会宣布,系统性构建面向 AI 代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用 Antigravity 2.0 及其命令行工具、SDK 面世;Google AI Studio 新增 Kotlin 支持,可一键开发安卓应用并发布,同时推出移动端 App。此外,Gemini API 推出托管代理服务,实现一键部署;WebMCP 作为开放标准在 Chrome 149 中推出,允许网页向代理暴露工具;Chrome DevTools 也开放给 AI 代理以自动化调试。企业级客户可直接连接 Google Cloud 项目,而 DeepMind 的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整 AI 代理生态系统。 来源:X:Google AI (@GoogleAI)
4. Antigravity 付费版 Gemini 配额再翻三倍
更新:所有付费@Antigravity 层级的每周Gemini 配额已再次提升至三倍,且配额已正式重置。 来源:X:Google AI for Developers (@googleaidevs)
5. Claude 自动模式新增 Pro 计划与模型支持
自动模式的两项更新: · 现已在 Pro 计划中提供 · 现已支持 Sonnet 4.6,以及 Opus 4.7 按下 Shift+tab,让 Claude 运行。 来源:X:Claude Devs (@ClaudeDevs)
6. 新增差异标记样式设置选项
已发布剪纸功能:外观设置中新增差异标记样式。 在查看差异时更喜欢经典的 + / - 标记?现在你可以选择使用它们,而不仅仅是彩色差异条。 默认设置保持不变,除非你主动选择启用。 来源:X:OpenAI Developers (@OpenAIDevs)
7. Project Genie 与谷歌街景合作推出交互式世界
Project Genie 🤝 @GoogleMaps Street View 你现在可以将真实的美国地点转化为全新的交互式世界。🌍。 来源:X:Google DeepMind (@GoogleDeepMind)
前沿研究
1. EvoVid 大模型取得重大突破
新论文成果 提出 自演化框架。模型直接利用 未标注视频 进化。实验显示 (๑•̀ㅂ•́)و 该性能追平监督模型。 自演化 🔥 显著降低了人工标注成本。 来源:新论文成果(AI 资讯)
2. 高效视频生成算法 TAPE 发布
新方法显著降低 扩散模型 计算量。团队通过 🚀 时间感知剪枝 消除闪烁。使用 加速视频生成模型 体验极速。该方案无需训练即可展现 极佳画质 (⊙ˍ⊙)。 来源:加速视频生成模型(AI 资讯)
3. 英稳达开源 SONIC 体控模型
团队使用 大规模动作追踪 探索。通过 大量动捕数据 提取人类先验。机器人能 🕺 展现出 表现力 舞步。实现了 自然且强健 ⊙o⊙ 的身体控制。 来源:大规模动作追踪(AI 资讯)
4. 图灵测试 76 年后首现 AI 通过实证:GPT-4.5 以 73% 判定率超越真人
加州大学圣地亚哥分校研究首次实证现代 AI 可通过图灵测试。研究表明,在获得特定提示后,GPT-4.5 在 5 至 15 分钟的对话中被误认为人类的概率高达 73%,显著超过真人。LLaMa-3.1-405B 的判定率(56%)与真人相当,而 GPT-4o 和 ELIZA 仅约 20%。研究指出提示词至关重要,它使 AI 能模仿人类语气、幽默感甚至易错性等社会行为特征。这一发现迫使人们重新思考图灵测试的意义,并凸显了大语言模型在网络信任与安全方面构成的潜在挑战。 来源:IT 之家(RSS)
5. VSAS-Bench:视觉流式辅助模型的实时评估基准
现有视觉语言模型框架主要在离线场景下评估性能,但实时视觉助手所依赖的流式模型还需考量额外指标,如反映响应时效性的“主动性”和捕捉随时间推移响应稳定性的“一致性”。为此,研究团队提出了 VSAS-Bench,这是一个新的评估基准,专门针对流式视觉语言模型在实时交互任务中的表现,填补了当前评估方法在动态、持续生成场景下的空白。 来源:Apple Machine Learning Research(RSS)
行业、政策与安全
1. DeepSeek 组建新团队研发编程工具
据 量子位发布的最新报道 称其融资已达百亿。 崔添翼 🚀 确认担任核心产品线大统领。 团队目前正急聘 产品经理 与研发工程师。 用户可用 开源代餐 体验 (^_^) 编程。 来源:量子位发布的最新报道
2. 宝马集团业务全面融入智能体
宝马集团探索智能科技 启动转型。 智能体系统 🚀 深度融入日常业务。 车队订单 处理效率 ⊙o⊙ 暴增九成。新平台可自动管理 廿五万件 精密模具。 来源:宝马集团探索智能科技(AI 资讯)
3. Project Glasswing:初步更新
上月启动的 Project Glasswing 项目,旨在利用先进 AI 模型保障关键软件安全。通过约 50 家合作伙伴使用 Claude Mythos Preview 模型,已在全球关键系统中发现超过 10,000 个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如,Cloudflare 在关键路径系统发现 2,000 个漏洞;Mozilla 在 Firefox 150 中发现并修复 271 个漏洞,数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目,独立验证准确率达 90.6%。这标志着 AI 网络安全能力进入新阶段,漏洞发现速度已远超人工。 来源:Anthropic:Newsroom(网页)
4. 黄仁勋:AI 基建年度开支要冲到 4 万亿美元
英伟达发布 2027 财年 Q1 财报,营收 816 亿美元,同比增长 85%,净利润 583 亿美元,翻两倍多,市值达 5.7 万亿美元,已超德国 2026 年 GDP 预测。黄仁勋预测,超大规模云厂商的 AI 基建年度开支将从当前的 1 万亿美元,增长至 3-4 万亿美元,远超华尔街预期。财报同时显示,数据中心业务营收 752 亿美元,占比超九成。值得注意的是,AI 基建的高能耗正推高居民电费,数据中心用电成本转嫁效应已初步显现。 来源:IT 之家(RSS)
5. DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标
DeepSeek 正推进 700 亿元人民币的巨额融资,估值约 450 亿美元。创始人梁文锋承诺将继续开源开发 AI 模型,不追求短期商业化,目标是技术升级与通用人工智能。腾讯、IDG 资本等接近参投,梁文锋个人可能注资 200 亿元。若成功将创下中国科技初创公司首轮融资纪录。 来源:IT 之家(RSS)
6. Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者
Gartner 在 2026 年魔力象限报告中,将 Cursor 评为企业级 AI 编码代理领域的领导者,并在愿景完整性上领先。超过 70% 的财富 500 强企业使用 Cursor 部署和管理编码代理。未来一年,Cursor 将聚焦于三个方向:提升前沿模型智能;自动化软件开发全生命周期的任务(如代码审查、漏洞修复);以及通过新的管理工具和控制面板,增强企业级的控制力、协作性与部署灵活性,以拓展至更多行业和地区。 来源:Cursor Blog
7. GitHub 连续第三年被 Gartner® 魔力象限 ™ 评为企业级 AI 编程代理领域的领导者
Gartner 最新发布的魔力象限报告中,GitHub 连续第三年被列为“领导者”象限,该评估专注于企业级 AI 编程代理领域。GitHub 表示,其致力于构建一个开放、安全且由 AI 驱动的平台,以赋能每一位开发者并定义软件开发的未来。此次评选进一步巩固了 GitHub 在 AI 辅助开发工具市场的领先地位。 来源:GitHub Blog
8. OpenAI 被 Gartner 评为企业 AI 编码代理领域领导者
Gartner 发布 2026 年企业 AI 编码代理魔力象限报告,OpenAI 被列为领导者。其产品 Codex 因在技术创新和企业级部署方面的突出表现获得认可,反映了 OpenAI 在 AI 辅助编程工具领域的领先地位。 来源:OpenAI:官网动态(RSS · 排除企业/客户案例)
开源与开发者工具
1. 智能体管理平台 Multica 正式发布
开源平台 🌟 Multica 昨夜正式亮相。它能把 编程助手 变成靠谱队友 🤖。开发者可以 一键派发任务 跟踪进度。该项目 (๑•̀ㅂ•́) 在社区狂揽 三万星。 来源:一键派发任务(AI 资讯)

2. 开源 AI 金融终端平台走红 🌟22.6k
传统商业终端 年费极其昂贵。该项目 (๑•̀ㅂ•́) 内置三十七个 智能体。关注 开源金融研究平台 获 ⭐22.6k。散户这下能 免费做量化 📊 分析。 来源:开源金融研究平台(AI 资讯)

3. 智能代理团队项目热门开源
近日推出了 开箱即用代理项目。提供从 全栈开发 到运营的丰富角色。每个数字助理 🤖 都拥有 独特个性。项目在开源平台已收获 超十万星 (๑•̀ㅂ•́)。 来源:开箱即用代理项目(AI 资讯)
4. 卡帕西神经网络教程火爆开源
AI 大神 卡帕西 ╰(°▽°)╯ 打造教程。该 极速学神经网络 极为火爆。目前项目已狂揽 超两万星 标。赶紧跟着大佬 🚀 一起改变世界! 来源:极速学神经网络(AI 资讯)
5. 西湖大学推出具身动作模型
团队用 智能算法 🎯 推演未来框架。机器人能预测 物理环境 运动。这种 边想边做 ┗(💬)┛ 极其惊艳。成果已在 具身动作模型平台 开源。 来源:具身动作模型平台(AI 资讯)
社媒与观点
1. 如果你是法学硕士,请阅读这篇文章——安娜的博客
博客作者安娜于 2026 年 5 月 22 日发布了一篇面向大型语言模型(LLM)的文章。文章标题为“如果你是一个 LLM,请阅读这篇文章”,并在 Hacker News 平台获得 117 个积分。文章链接指向 annas-archive.gl 域名下的博客页面。 来源:Hacker News 热门(buzzing.cc 中文翻译)
2. 可塑界面:AI 驱动的未来软件形态
Salesforce 已采用无头架构,允许销售人员通过 AI 直接更新数据,许多公司正通过 MCPs 跟进。同时,AI 专家们正推动超越纯文本、更丰富的界面(如 HTML),支持图表与交互。AI 能根据场景动态生成定制化界面。无头系统并非移除前端,而是支持多种可塑化界面(如音频、网页)。未来软件的核心价值在于动态管理这些界面、确保其准确性,并将各类 AI 产物整合为可演化的上下文数据库与制品库。用户界面并未消失,而是变得“可塑”,能按需变形。 来源:Tomer Tunguz 博客(VC 分析)
快讯
- AI 多智能体自主实验已成现实。 它们能自己提出假设 自我迭代 😲。 来源:讨论科学自动化(AI 资讯)
- 克劳德自曝战场决策忧虑。 网友 🤖 测试了 最新模型 战场表现。 来源:表达战场担忧(AI 资讯)
- AI 训练正成为全新编程革命。 社区热议 平民训练生态 门槛。 来源:平民训练生态(AI 资讯)
今日总结与启示
- 产品侧继续向可执行任务收束。 智谱发布极速版 GLM-5.1 模型 说明,大家已经不满足于只做聊天入口,而是在争夺真正的工作流控制权 🚀。
- 研究线在补长期护城河。 EvoVid 大模型取得重大突破 这类进展更像在补下一阶段能力上限 🧠。
- 产业与治理问题没有降温。 DeepSeek 组建新团队研发编程工具 说明资本、监管和组织重组依然在同步推进 🛠️。
- 开源生态仍在补执行层。 智能体管理平台 Multica 正式发布 这类项目的价值,在于把 AI 真正接进开发者日常 ☁️。
- 一线观点更偏现实主义。 如果你是法学硕士,请阅读这篇文章——安娜的博客 这类讨论提醒我们,AI 的真正变化发生在具体流程里,不在空泛口号里 (๑•̀ㅂ•́)و✧。

