2026-05-23 AI大事件

今日摘要

智谱发布极速版 GLM-5.1 模型、钉钉发布悟空工作平台 把这一天的产品面直接拉满，智能体、协作和多模态入口都在继续往前推 🚀
EvoVid 大模型取得重大突破、高效视频生成算法 TAPE 发布 代表的研究线说明，基础能力和形式化推理仍是当天最硬的增量之一 🧠
DeepSeek组建新团队研发编程工具、宝马集团业务全面融入智能体 把产业竞争、资本流向与治理问题一起推到台前 🛠️
开源区则由 智能体管理平台 Multica 正式发布、开源 AI 金融终端平台走红 带头，开发者基础设施还在继续升温 ☁️
社媒与观点部分里，如果你是法学硕士，请阅读这篇文章——安娜的博客、可塑界面：AI驱动的未来软件形态 这些讨论把“AI 真的怎样改变工作流”讲得更具体了 ( •̀ ω •́ )
整体来看，这一天最值得记住的信号仍是：模型能力、执行工具和现实业务场景正在更快地收敛到一起 (๑•̀ㅂ•́)و✧

模型与产品更新

1. 智谱发布极速版 GLM-5.1 模型

港股智谱股价 📈 盘中瞬间暴涨。该模型输出达到 ⚡ 每秒四百标记。用户可体验极速模型获益。高性能引擎彻底打破了行业惯例。新版本支持超长上下文 (๑•̀ㅂ•́) 窗口。来源：体验极速模型(AI 资讯)

2. 钉钉发布悟空工作平台

该平台拥有自主执行复杂任务的本领。用户可用白话与智能助手 🌟 沟通。现场演示的会议听记功能简直强到离谱。多家制造业与电商巨头 (⊙ˍ⊙) 当场战略签约了。来源：智能助手（AI 资讯）

3. 谷歌 I/O 大会发布 AI 代理全套开发工具链

谷歌在 I/O 开发者大会宣布，系统性构建面向 AI 代理（Agent）的开发与部署工具链。核心更新包括：独立桌面应用 Antigravity 2.0 及其命令行工具、SDK 面世；Google AI Studio 新增 Kotlin 支持，可一键开发安卓应用并发布，同时推出移动端 App。此外，Gemini API 推出托管代理服务，实现一键部署；WebMCP 作为开放标准在 Chrome 149 中推出，允许网页向代理暴露工具；Chrome DevTools 也开放给 AI 代理以自动化调试。企业级客户可直接连接 Google Cloud 项目，而 DeepMind 的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整 AI 代理生态系统。来源：X：Google AI (@GoogleAI)

4. Antigravity 付费版 Gemini 配额再翻三倍

更新：所有付费@Antigravity 层级的每周Gemini 配额已再次提升至三倍，且配额已正式重置。来源：X：Google AI for Developers (@googleaidevs)

5. Claude 自动模式新增 Pro 计划与模型支持

自动模式的两项更新： · 现已在 Pro 计划中提供 · 现已支持 Sonnet 4.6，以及 Opus 4.7 按下 Shift+tab，让 Claude 运行。来源：X：Claude Devs (@ClaudeDevs)

6. 新增差异标记样式设置选项

已发布剪纸功能：外观设置中新增差异标记样式。在查看差异时更喜欢经典的 + / - 标记？现在你可以选择使用它们，而不仅仅是彩色差异条。默认设置保持不变，除非你主动选择启用。来源：X：OpenAI Developers (@OpenAIDevs)

7. Project Genie 与谷歌街景合作推出交互式世界

Project Genie 🤝 @GoogleMaps Street View 你现在可以将真实的美国地点转化为全新的交互式世界。🌍。来源：X：Google DeepMind (@GoogleDeepMind)

前沿研究

1. EvoVid 大模型取得重大突破

新论文成果提出自演化框架。模型直接利用未标注视频进化。实验显示 (๑•̀ㅂ•́)و 该性能追平监督模型。自演化 🔥 显著降低了人工标注成本。来源：新论文成果(AI 资讯)

2. 高效视频生成算法 TAPE 发布

新方法显著降低扩散模型计算量。团队通过 🚀 时间感知剪枝消除闪烁。使用加速视频生成模型体验极速。该方案无需训练即可展现极佳画质 (⊙ˍ⊙)。来源：加速视频生成模型(AI 资讯)

3. 英稳达开源 SONIC 体控模型

团队使用大规模动作追踪探索。通过大量动捕数据提取人类先验。机器人能 🕺 展现出表现力舞步。实现了自然且强健 ⊙o⊙ 的身体控制。来源：大规模动作追踪(AI 资讯)

4. 图灵测试 76 年后首现 AI 通过实证：GPT-4.5 以 73% 判定率超越真人

加州大学圣地亚哥分校研究首次实证现代 AI 可通过图灵测试。研究表明，在获得特定提示后，GPT-4.5 在 5 至 15 分钟的对话中被误认为人类的概率高达 73%，显著超过真人。LLaMa-3.1-405B 的判定率（56%）与真人相当，而 GPT-4o 和 ELIZA 仅约 20%。研究指出提示词至关重要，它使 AI 能模仿人类语气、幽默感甚至易错性等社会行为特征。这一发现迫使人们重新思考图灵测试的意义，并凸显了大语言模型在网络信任与安全方面构成的潜在挑战。来源：IT 之家（RSS）

5. VSAS-Bench：视觉流式辅助模型的实时评估基准

现有视觉语言模型框架主要在离线场景下评估性能，但实时视觉助手所依赖的流式模型还需考量额外指标，如反映响应时效性的“主动性”和捕捉随时间推移响应稳定性的“一致性”。为此，研究团队提出了 VSAS-Bench，这是一个新的评估基准，专门针对流式视觉语言模型在实时交互任务中的表现，填补了当前评估方法在动态、持续生成场景下的空白。来源：Apple Machine Learning Research（RSS）

行业、政策与安全

1. DeepSeek 组建新团队研发编程工具

据量子位发布的最新报道称其融资已达百亿。崔添翼 🚀 确认担任核心产品线大统领。团队目前正急聘产品经理与研发工程师。用户可用开源代餐体验 (^_^) 编程。来源：量子位发布的最新报道

2. 宝马集团业务全面融入智能体

宝马集团探索智能科技启动转型。智能体系统 🚀 深度融入日常业务。车队订单处理效率 ⊙o⊙ 暴增九成。新平台可自动管理廿五万件精密模具。来源：宝马集团探索智能科技(AI 资讯)

3. Project Glasswing：初步更新

上月启动的 Project Glasswing 项目，旨在利用先进 AI 模型保障关键软件安全。通过约 50 家合作伙伴使用 Claude Mythos Preview 模型，已在全球关键系统中发现超过 10,000 个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如，Cloudflare 在关键路径系统发现 2,000 个漏洞；Mozilla 在 Firefox 150 中发现并修复 271 个漏洞，数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目，独立验证准确率达 90.6%。这标志着 AI 网络安全能力进入新阶段，漏洞发现速度已远超人工。来源：Anthropic：Newsroom（网页）

4. 黄仁勋：AI 基建年度开支要冲到 4 万亿美元

英伟达发布 2027 财年 Q1 财报，营收 816 亿美元，同比增长 85%，净利润 583 亿美元，翻两倍多，市值达 5.7 万亿美元，已超德国 2026 年 GDP 预测。黄仁勋预测，超大规模云厂商的 AI 基建年度开支将从当前的 1 万亿美元，增长至 3-4 万亿美元，远超华尔街预期。财报同时显示，数据中心业务营收 752 亿美元，占比超九成。值得注意的是，AI 基建的高能耗正推高居民电费，数据中心用电成本转嫁效应已初步显现。来源：IT 之家（RSS）

5. DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标

DeepSeek 正推进 700 亿元人民币的巨额融资，估值约 450 亿美元。创始人梁文锋承诺将继续开源开发 AI 模型，不追求短期商业化，目标是技术升级与通用人工智能。腾讯、IDG 资本等接近参投，梁文锋个人可能注资 200 亿元。若成功将创下中国科技初创公司首轮融资纪录。来源：IT 之家（RSS）

6. Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者

Gartner 在 2026 年魔力象限报告中，将 Cursor 评为企业级 AI 编码代理领域的领导者，并在愿景完整性上领先。超过 70% 的财富 500 强企业使用 Cursor 部署和管理编码代理。未来一年，Cursor 将聚焦于三个方向：提升前沿模型智能；自动化软件开发全生命周期的任务（如代码审查、漏洞修复）；以及通过新的管理工具和控制面板，增强企业级的控制力、协作性与部署灵活性，以拓展至更多行业和地区。来源：Cursor Blog

7. GitHub 连续第三年被 Gartner® 魔力象限 ™ 评为企业级 AI 编程代理领域的领导者

Gartner 最新发布的魔力象限报告中，GitHub 连续第三年被列为“领导者”象限，该评估专注于企业级 AI 编程代理领域。GitHub 表示，其致力于构建一个开放、安全且由 AI 驱动的平台，以赋能每一位开发者并定义软件开发的未来。此次评选进一步巩固了 GitHub 在 AI 辅助开发工具市场的领先地位。来源：GitHub Blog

8. OpenAI 被 Gartner 评为企业 AI 编码代理领域领导者

Gartner 发布 2026 年企业 AI 编码代理魔力象限报告，OpenAI 被列为领导者。其产品 Codex 因在技术创新和企业级部署方面的突出表现获得认可，反映了 OpenAI 在 AI 辅助编程工具领域的领先地位。来源：OpenAI：官网动态（RSS · 排除企业/客户案例）

开源与开发者工具

1. 智能体管理平台 Multica 正式发布

开源平台 🌟 Multica 昨夜正式亮相。它能把编程助手变成靠谱队友 🤖。开发者可以一键派发任务跟踪进度。该项目 (๑•̀ㅂ•́) 在社区狂揽三万星。来源：一键派发任务(AI 资讯)

AI资讯：Multica开源智能体平台工作流架构图

2. 开源 AI 金融终端平台走红 🌟22.6k

传统商业终端年费极其昂贵。该项目 (๑•̀ㅂ•́) 内置三十七个智能体。关注开源金融研究平台获 ⭐22.6k。散户这下能免费做量化 📊 分析。来源：开源金融研究平台(AI 资讯)

AI资讯：开源金融研究平台项目界面截图

3. 智能代理团队项目热门开源

近日推出了开箱即用代理项目。提供从全栈开发到运营的丰富角色。每个数字助理 🤖 都拥有独特个性。项目在开源平台已收获超十万星 (๑•̀ㅂ•́)。来源：开箱即用代理项目(AI 资讯)

4. 卡帕西神经网络教程火爆开源

AI 大神卡帕西 ╰(°▽°)╯ 打造教程。该极速学神经网络极为火爆。目前项目已狂揽超两万星标。赶紧跟着大佬 🚀 一起改变世界！来源：极速学神经网络(AI 资讯)

5. 西湖大学推出具身动作模型

团队用智能算法 🎯 推演未来框架。机器人能预测物理环境运动。这种边想边做 ┗(💬)┛ 极其惊艳。成果已在具身动作模型平台开源。来源：具身动作模型平台(AI 资讯)

社媒与观点

1. 如果你是法学硕士，请阅读这篇文章——安娜的博客

博客作者安娜于 2026 年 5 月 22 日发布了一篇面向大型语言模型（LLM）的文章。文章标题为“如果你是一个 LLM，请阅读这篇文章”，并在 Hacker News 平台获得 117 个积分。文章链接指向 annas-archive.gl 域名下的博客页面。来源：Hacker News 热门（buzzing.cc 中文翻译）

2. 可塑界面：AI 驱动的未来软件形态

Salesforce 已采用无头架构，允许销售人员通过 AI 直接更新数据，许多公司正通过 MCPs 跟进。同时，AI 专家们正推动超越纯文本、更丰富的界面（如 HTML），支持图表与交互。AI 能根据场景动态生成定制化界面。无头系统并非移除前端，而是支持多种可塑化界面（如音频、网页）。未来软件的核心价值在于动态管理这些界面、确保其准确性，并将各类 AI 产物整合为可演化的上下文数据库与制品库。用户界面并未消失，而是变得“可塑”，能按需变形。来源：Tomer Tunguz 博客（VC 分析）

快讯

AI 多智能体自主实验已成现实。 它们能自己提出假设自我迭代 😲。来源：讨论科学自动化(AI 资讯)
克劳德自曝战场决策忧虑。 网友 🤖 测试了最新模型战场表现。来源：表达战场担忧(AI 资讯)
AI 训练正成为全新编程革命。 社区热议平民训练生态门槛。来源：平民训练生态(AI 资讯)

今日总结与启示

产品侧继续向可执行任务收束。 智谱发布极速版 GLM-5.1 模型说明，大家已经不满足于只做聊天入口，而是在争夺真正的工作流控制权 🚀。
研究线在补长期护城河。 EvoVid 大模型取得重大突破这类进展更像在补下一阶段能力上限 🧠。
产业与治理问题没有降温。 DeepSeek 组建新团队研发编程工具说明资本、监管和组织重组依然在同步推进 🛠️。
开源生态仍在补执行层。 智能体管理平台 Multica 正式发布这类项目的价值，在于把 AI 真正接进开发者日常 ☁️。
一线观点更偏现实主义。 如果你是法学硕士，请阅读这篇文章——安娜的博客这类讨论提醒我们，AI 的真正变化发生在具体流程里，不在空泛口号里 (๑•̀ㅂ•́)و✧。

2026-05-23 AI大事件

今日摘要 ​

模型与产品更新 ​

1. 智谱发布极速版 GLM-5.1 模型 ​

2. 钉钉发布悟空工作平台 ​

3. 谷歌 I/O 大会发布 AI 代理全套开发工具链 ​

4. Antigravity 付费版 Gemini 配额再翻三倍 ​

5. Claude 自动模式新增 Pro 计划与模型支持 ​

6. 新增差异标记样式设置选项 ​

7. Project Genie 与谷歌街景合作推出交互式世界 ​

前沿研究 ​

1. EvoVid 大模型取得重大突破 ​

2. 高效视频生成算法 TAPE 发布 ​

3. 英稳达开源 SONIC 体控模型 ​

4. 图灵测试 76 年后首现 AI 通过实证：GPT-4.5 以 73% 判定率超越真人 ​

5. VSAS-Bench：视觉流式辅助模型的实时评估基准 ​

行业、政策与安全 ​

1. DeepSeek 组建新团队研发编程工具 ​

2. 宝马集团业务全面融入智能体 ​

3. Project Glasswing：初步更新 ​

4. 黄仁勋：AI 基建年度开支要冲到 4 万亿美元 ​

5. DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标 ​

6. Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者 ​

7. GitHub 连续第三年被 Gartner® 魔力象限 ™ 评为企业级 AI 编程代理领域的领导者 ​

8. OpenAI 被 Gartner 评为企业 AI 编码代理领域领导者 ​

开源与开发者工具 ​

1. 智能体管理平台 Multica 正式发布 ​

2. 开源 AI 金融终端平台走红 🌟22.6k ​

3. 智能代理团队项目热门开源 ​

4. 卡帕西神经网络教程火爆开源 ​

5. 西湖大学推出具身动作模型 ​

社媒与观点 ​

1. 如果你是法学硕士，请阅读这篇文章——安娜的博客 ​

2. 可塑界面：AI 驱动的未来软件形态 ​

快讯 ​

今日总结与启示 ​