钢铁文章网
你的位置: 首页 > 实时讯息 >

华为UCM、英伟达Cosmos Reason、达摩院开源“三大件”……一周AI大事记

0次浏览     发布时间:2025-08-18 05:00:00    

AI与机器人

01 智元发布机器人世界模型平台Genie Envisioner

8月14日,智元推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner(GE)。 与传统“数据-训练-评估”的割裂流水线模式相比,GE将未来帧预测、策略学习与仿真评估整合,以视频生成为核心形成闭环架构。

基于约3000小时的真实机器人操控视频数据,GE建立了从语言指令到视觉空间的直接映射,保留了机器人与环境交互的完整时空信息,让机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。

• 点评:当前,机器人学习系统普遍采用分阶段开发模式,这种碎片化架构增加了开发的复杂度,延长了迭代周期,限制了系统的可扩展性。不同于主流VLA(视觉-语言-动作)模型利用视觉-语言进行间接建模,GE可以直接在视觉空间中建模,让机器人完成“想象-验证-行动”的完整闭环。(曹妍)

02 英伟达发布Cosmos Reason

8月11日,英伟达发布机器人视觉语言模型(VLM)Cosmos Reason,它拥有70亿参数,用于机器人等具身智能,让机器人和AI代理能够像人类一样进行推理,利用先验知识、常识来理解现实世界,并在现实世界中行动。

同时,现有Cosmos世界模型系列将新增Cosmos Transfer-2,能加速从3D模拟场景或空间控制输入中生成合成数据。此外,英伟达还推出了一系列面向机器人开发者的数据库及相关基础设施。

• 点评:Cosmos Reason的突破在于解决多步骤任务,有望应用于数据管理、机器人规划和视频分析等领域。这一系列动作,标志着英伟达正在加码进军机器人赛道,拓展AI数据中心之外的下一个重要应用场景。(曹妍)

03 达摩院开源具身智能“三大件”

8月11日,阿里达摩院宣布开源自研的VLA模型RynnVLA-001-7B、世界理解模型RynnEC,以及机器人上下文协议RynnRCP,推动数据、模型与机器人的兼容适配,打通具身智能开发的全流程。

达摩院将MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了RCP(Robotics Context Protocol)协议,以推动不同的数据、模型与本体之间的对接适配。达摩院打造了名为RynnRCP的一套完整的机器人服务协议和框架,能够打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,帮助用户根据自身场景轻松适配。

RynnVLA-001是达摩院自主研发的基于视频生成和人体轨迹预训练的视觉-语言-动作模型,能够从第一人称视角的视频中学习人类的操作技能,隐式迁移到机器人手臂的操控上,从而让机械臂的操控更加连贯、平滑,更接近于人类动作。

世界理解模型RynnEC将多模态大语言模型引入具身世界,赋予了大模型理解物理世界的能力。该模型能够从位置、功能、数量等11个维度全面解析场景中的物体,并在复杂的室内环境中精准定位和分割目标物体。无需3D模型,该模型仅靠视频序列就能建立连续的空间感知,还支持灵活交互。

此外,达摩院还在2025年7月开源了WorldVLA模型,首次将世界模型与动作模型融合,提升了图像和动作的理解与生成能力。

• 点评:具身智能让AI不再局限于虚拟世界,而是拥有 “身体”,能与现实环境互动并不断提升。但目前具身智能领域的发展存在开发流程碎片化,以及数据、模型与机器人本体适配难等难题,达摩院“三大件”为解决当前的难题提供了新的思路和方法。(罗仙仙)

AI与医药

04 浙江发布“AI+医疗健康”三年行动计划

8月12日,浙江省卫健委等十部门印发《浙江省加快推动“人工智能+医疗健康”高质量发展行动计划(2025-2027年)》,从构建支撑体系、打造共享平台、加快行业应用、培育产业生态四方面提出18项重点任务;同时明确,到2027年,全面建成国家人工智能医疗行业应用基地,打造以安诊儿医疗大模型为核心的医疗智能体集群,培育50个以上高质量行业语料库和专病专科模型,突破转化10项以上医学AI核心技术,建设面向公众、医生、医院、科研、产业、政府等6大领域100个以上医疗健康重点场景。

• 点评:一个月前,北京发布AI医疗专项政策《北京市加快推动“人工智能+医药健康”创新发展行动计划(2025-2027年)》,浙江也在跟进。浙江的上述行动计划不仅围绕算力、数据、模型等方面做出规划,同时构建“技术-临床-产业”三位一体的智能医疗新生态,期待“AI+医疗健康”的成效。(卫酉祎)

05 百川智能发布开源医疗增强大模型

8月11日,中国AI企业百川智能发布开源医疗增强大模型Baichuan-M2,称其在HealthBench上得到60.1的高分,以32B的较小尺寸反超OpenAI 最新开源模型gpt-oss120b(得分57.6),更力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型。

2025年1月,百川智能在业内首发“AI患者模拟器”,用真实数据构造上万个不同年龄性别症状的AI患者,模拟了数百万次诊疗过程。基于该范式开源的Baichuan-M1,通过升级患者模拟器并引入模型端到端强化学习,训练发布了Baichuan-M2。Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX4090上单卡部署,相比DeepSeek-R1 H20双节点部署的方式,成本降低了57倍。

• 点评:医疗领域是AI发展的重要方向之一,M2的发布是其在医疗领域的一次阶段性突破,在评测中领先除GPT5以外所有的开源闭源前沿模型,同时落地门槛较低,更多中小型医疗机构也能负担起医疗大模型的私有部署。(罗仙仙)

AI for Science

06 AI从头设计抗生素,精准杀灭耐药菌

8 月 14 日,Broad 研究所/麻省理工学院 James Collins 团队在《细胞》(Cell) 发表论文A generative deep learning approach to de novo antibiotic design。研究团队开发了一种生成式人工智能框架,通过基于片段的方法(CReM)和无约束的从头化合物生成法(VAE),并使用遗传算法和变异自动编码器,共生成了超过 3600 万种从未被记录具有预测抗菌活性的化合物。经过筛选,研究团队合成了生成的24种化合物,有7种表现出选择性抗菌活性,最终他们成功设计出两种新型抗生素分子,能够快速、精准地杀灭淋病奈瑟菌和耐甲氧西林金黄色葡萄球菌等耐药菌,显著降低小鼠体内细菌的负荷量,且对人类细胞具有安全性。

• 点评:耐药菌增加了人们治疗感染性疾病的难度,耐药菌在持续进化,研制新的抗生素成为当务之急。这一生成式人工智能框架,开拓了抗生素生成设计的新局面。(李一跞)

07 利用AI加速核聚变装置安全设计

8月13日,普林斯顿等离子体物理实验室(PPPL)、橡树岭国家实验室(ORNL)与Commonwealth Fusion Systems公司(CFS)在《融合工程与设计》(Fusion Engineering and Design)发表论文Shadow masks predictions in SPARC tokamak plasma-facing components using HEAT code and machine learning methods,报告他们利用最新研发的AI模型HEAT-ML加速SPARC 托卡马克等离子体面组件中 “磁阴影”的计算过程,从而为核聚变装置的安全防护和高效设计提供了关键的技术支撑。

HEAT-ML单次模拟从原来的约30分钟跃升至毫秒级,实现了数千倍的加速,其核心在于利用深度神经网络替代传统的物理计算流程,能够根据输入的几何和磁场信息,瞬间预测出映射图,完全绕过了耗时的磁力线追踪和碰撞检测的过程。

• 点评:可控核聚变的推进速度,不仅取决于材料和工程等领域的进展,更因为有AI技术的辅助,可加快模拟和验证过程,还将为运行决策提供依据。(李一跞)

AI技术与人才
08 华为发布AI推理技术UCM

8月12日,华为发布AI推理技术——UCM推理记忆数据管理器,并计划于2025年9月正式开源。UCM是一款以KV Cache(Transformer的推理加速功能,核心是缓存Key和Value以避免重复计算)为中心的推理加速套件,包括对接不同引擎和算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理的“更优体验、更低成本”。

• 点评:推理和训练是 AI 模型生命周期中的两个核心阶段。UCM有望降低中国AI推理对HBM(高带宽内存)技术的依赖,为提升AI的推理体验、优化推理效率和成本提供了一种新的解决方案。(卫酉祎)

09 美国发布人才战略:为黄金时代的美国劳动力赋能

8月12日,美国商务部、劳工部、教育部联合发布《美国人才战略:为黄金时代的美国劳动力赋能》(America’s Talent Strategy: Equipping American Workers for the Golden Age),旨在根据不断变化的经济、技术和人口趋势,加强美国的劳动力系统。

该战略从五个部分论述如何发展劳动力、推进美国优先的议程:1.需求驱动,通过由行业主导并与美国经济优先事项相一致的劳动力系统,建立可靠的人才输送管道;2.工人的流动性, 让更多的美国人加入劳动力大军,包括通过创新使用技术和劳动力市场数据,帮助他们提高地位;3.系统集成,简化联邦劳动力的发展项目,赋予各州权力,统一工人和企业系统接入,推进特朗普政府关于“让美国再次具备技能”的提案;4.建立问责制,通过将投资与成果挂钩并执行绩效纪律,确保联邦资助的劳动力计划取得可衡量的成果;5.灵活与创新,优先发展人工智能素养、建立人才与人工智能工作的新渠道等,创建新的劳动力创新模式,以适应人工智能驱动的经济转型的速度和规模。

• 点评:随着数智化的发展,生产设备在进化,劳动力该如何进化?劳动力的AI素养、AI相关技能提升,也将是大部分国家和地区即将面临的挑战。(李一跞)

南方周末科创力研究中心

责编 黄金萍

相关推荐