谷歌发布“嵌套学习”范式:让 AI 像人脑一样温故知新
- 来源:IT之家
- 2025-11-10 09:29:44
-
收藏
IT之家 11 月 10 日消息,谷歌研究院于 11 月 7 日发布博文,为攻克 AI 模型在持续学习新知识时遇到“灾难性遗忘”难题,介绍了嵌套学习(Nested Learning)全新机器学习范式。
当前的大语言模型尽管强大,但其知识仍局限于预训练数据或有限的上下文窗口,无法像人脑一样通过“神经可塑性”(Neuroplasticity,指大脑能够根据经验、学习和环境变化来调整自身结构和功能的能力)持续学习新技能而不遗忘旧知识。
若直接用新数据更新模型,往往会导致“灾难性遗忘”(Catastrophic Forgetting),即学会新任务后,旧任务的性能会严重下降。为解决这一根本性挑战,谷歌研究院的研究人员提出了全新的解决思路。
在发表于 NeurIPS 2025 的论文中,谷歌推出了“嵌套学习”(Nested Learning)范式。该范式从根本上统一了模型架构与优化算法这两个传统上被分开处理的概念。
该范式认为,一个复杂的机器学习模型,其本质是一系列相互嵌套或并行的优化问题,每个问题都有自己独立的“上下文流”和更新速率。这一视角揭示了一个全新的设计维度,允许研究人员构建计算深度更深的 AI 组件,从而有效缓解灾难性遗忘问题。
基于嵌套学习范式,研究团队提出了两项具体的技术改进:
- 第一是“深度优化器”(Deep optimizers),通过将优化器本身也视为一个学习模块,并改进其底层目标函数,使其对不完美的数据更具鲁棒性(一个系统或过程在面对不确定性、变化、错误输入或异常情况时,仍能保持其功能和稳定性能的能力)。
- 第二是“连续体内存系统”(Continuum Memory Systems,CMS),它将模型的内存视为一个由多个不同更新频率的模块组成的光谱,从短期记忆平滑过渡到长期记忆,创建了一个更丰富、更高效的持续学习内存体系。
为了验证上述理论,研究团队设计并实现了一款名为“Hope”的概念验证模型。Hope 是一种基于 Titans 架构的自修改循环网络,它深度集成了连续体内存系统(CMS),能够通过自我参照的过程优化自身内存,从而实现近乎无限层级的上下文学习。
在一系列公开的语言建模和常识推理任务中,Hope 架构的困惑度更低,准确性显著高于现代循环模型和标准 Transformer。
尤其在考验模型长文本记忆能力的“大海捞针”(Needle-In-Haystack,NIAH)测试中,Hope 展现出卓越的内存管理能力,证明连续体内存系统是处理超长信息序列的有效方案,为实现真正能“温故知新”的 AI 铺平了道路。
NIAH 是一种用于评测大型语言模型长文本理解和信息检索能力的基准测试,要求模型从非常长的文本(草堆,Haystack)中精准地找出并回答一个特定的信息点(针,Needle)。
IT之家附上参考地址
相关推荐
为什么“冬吃萝卜夏吃姜”(文化中国行·二十四节气二十四问)|当前热点
推荐 2025/11/10聚焦:记者实地探访中国移动位于四川省多地的低空经济项目应用
推荐 2025/11/10每日热点:中信建投:北美缺电逻辑持续演绎,储能放量确定性较高
推荐 2025/11/09即时看!你是为“帽子”而生,还是为学术而生?席南华院士灵魂拷问
推荐 2025/11/09行进中国丨长江边,“一棵菜”的升级答卷 每日热门
推荐 2025/11/09热门资讯 日 周 总
2025服贸会“肿瘤治疗创新进展与药物研发新趋势论坛”举办
健康 2025/09/22北京健康文化促进会运动健康风险评估专业委员会成立
健康 2025/09/22世界特应性皮炎日丨刷新AD治疗新目标,MDA助力患者“达标”治疗
健康 2025/09/22“你,就是全世界”施维雅用行动诠释以患者为中心
健康 2025/09/22我国首例舌下神经刺激植入手术落地上海
健康 2025/09/22澳门将办“绿色公众日”活动 鼓励市民环保生活
节目 2019/03/26抖音多闪精准推荐多位“好友” 博士生起诉抖音、多闪侵犯隐私权
节目 2019/03/25香港科学园举办大型创科招聘会 60秒求职擂台现场面试
节目 2019/03/13中国原创赛事高山定点滑雪公开赛总决赛落幕
节目 2019/03/12首例斑狐猴三胞胎正式与游客见面
节目 2019/03/07- 谷歌发布“嵌套学习”范式:让 AI 像人脑2025-11-10
- 为什么“冬吃萝卜夏吃姜”(文化中国行·二2025-11-10
- 特斯拉磁悬浮 Cybertruck 赛博越野车模型2025-11-10
- 聚焦:记者实地探访中国移动位于四川省多地2025-11-10
- 五洲特纸:因注销股份“特纸转债”转股价格2025-11-09
- 每日热点:中信建投:北美缺电逻辑持续演绎2025-11-09
- 操作系统相关企业哪家强_11月7日股票市盈率2025-11-09
- 即时看!你是为“帽子”而生,还是为学术而2025-11-09
- 行进中国丨长江边,“一棵菜”的升级答卷 2025-11-09
- 个人理财遇到瓶颈银行能提供解决方案吗?-2025-11-09
- 资讯:8人得分上双太残暴,还有文班和小狐2025-11-09
- 京津冀携手筑起新能源汽车“配套圈”2025-11-09
- 风险调整后收益怎么算?2025-11-09
- 天天快报!宁波奉化罗蒙村镇银行获批解散,2025-11-09
- 图说|泗洪主场破强敌 连胜势头再延续 每2025-11-08
- 新消息丨北交所新股又火了!美的、格力供应2025-11-08
- 最资讯丨广东丰祺木业有限公司成立 注册资2025-11-08
- 焦点日报:让AI世界更安全更美好:五大章节2025-11-08
- 盘点2025年教育业务板块上市公司,名单收好2025-11-08
- PriceSeek提醒:中石化公布PTA预收款价 焦2025-11-08
- 奥佳华:接受山西证券调研 即时2025-11-07
- 带你了解!“电池化学品”行业上市公司股票2025-11-07
- 每日消息!中国钢铁工业协会:10月我国出口2025-11-07
- 吴通控股股东户数减少343户,户均持股7.8万2025-11-07
- 珠港澳青年创业大讲堂在澳门大学开讲, 这2025-11-07
- 从“下线即达”看邦德激光:以高效交付重塑2025-11-07
- 歌尔集团、周大福等成立元气大展鸿途科技公2025-11-07
- 最新快讯!锂电池电解液添加剂龙头企业,名2025-11-07
- 焦点消息!2025年小麦板块三家龙头股,名单2025-11-07
- 中国互联网络信息中心发布《从互联网大数据2025-11-07


