速讯:DeepSeek新模型曝光?“MODEL1”现身开源社区
- 来源:上海证券报
- 2026-01-22 05:58:12
-
收藏
(相关资料图)
恰逢DeepSeek-R1模型发布一周年,DeepSeek新模型“MODEL1”现身开源社区。
近日,DeepSeek官方在GitHub更新了一系列FlashMLA代码,涉及的114个文件中,有数十处提到了此前未公开的“MODEL1”大模型标识符。
2025年2月,DeepSeek启动“开源周”,计划以每日解锁的形式逐步公开5个代码库,Flash MLA为首个开源项目。公开资料显示,Flash MLA通过优化Hopper GPU的内存访问和计算流程,显著提高可变长度序列的处理效率。其核心设计包括动态内存分配机制和并行解码策略,可减少冗余计算并提升吞吐量,尤其适用于大语言模型的推理任务。
在某些文件中,“MODEL 1”与已知的现有模型“V32”(即DeepSeek-V3.2)并列提及。行业分析认为,“MODEL1”或许代表一个不同于现有架构的新模型,可能正是DeepSeek还未对外发布的下一代模型(R2或者V4)。
此前有市场消息称,DeepSeek计划在2月春节前后发布新一代AI模型DeepSeek V4,但发布时间可能会视实际情况而变化。V4模型是DeepSeek 2024年12月发布的V3模型的迭代版,具备强大的编程能力。DeepSeek内部的初步测试显示,V4在编程能力上超过了目前市场上的其他顶级模型,如Anthropic的Claude和OpenAI的GPT系列。
2026年1月以来,DeepSeek动作不断,已陆续发布了两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的 “AI记忆模块(Engram)”。
1月12日,DeepSeek在github上发表新论文,文章由DeepSeek与北京大学合作完成,作者中有梁文锋署名。文章指出,Transformer架构缺乏原生的知识查找机制,迫使它们通过计算低效地模拟检索。为此,DeepSeek提出了条件记忆(conditional memory),并给出了实现方案Engram模块。DeepSeek称,该模块不仅有助于知识检索,同时在一般推理和代码/数学领域方面取得了更大的进步。
在业内看来,梁文锋旗下私募幻方量化较高的收益率,为DeepSeek的研发提供了更多支持。公开资料显示,幻方量化2025年的收益均值达56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以73.51%收益均值登顶的灵均投资。目前,幻方量化管理规模已超700亿元。
相关推荐
速讯:DeepSeek新模型曝光?“MODEL1”现身开源社区
推荐 2026/01/22PriceSeek重点提醒:乌兰察布铁合金产业产值破千亿
推荐 2026/01/21每日看点!湘财证券2025年净利倍增,合并大智慧仍不确定
推荐 2026/01/21西安、郑州超过成都、重庆,中欧班列格局何以生变 焦点热闻
推荐 2026/01/20凯龙高科:拟购买深圳市金旺达机电有限公司的控制权
推荐 2026/01/20热门资讯 日 周 总
2025服贸会“肿瘤治疗创新进展与药物研发新趋势论坛”举办
健康 2025/09/22北京健康文化促进会运动健康风险评估专业委员会成立
健康 2025/09/22世界特应性皮炎日丨刷新AD治疗新目标,MDA助力患者“达标”治疗
健康 2025/09/22“你,就是全世界”施维雅用行动诠释以患者为中心
健康 2025/09/22我国首例舌下神经刺激植入手术落地上海
健康 2025/09/22澳门将办“绿色公众日”活动 鼓励市民环保生活
节目 2019/03/26抖音多闪精准推荐多位“好友” 博士生起诉抖音、多闪侵犯隐私权
节目 2019/03/25香港科学园举办大型创科招聘会 60秒求职擂台现场面试
节目 2019/03/13中国原创赛事高山定点滑雪公开赛总决赛落幕
节目 2019/03/12首例斑狐猴三胞胎正式与游客见面
节目 2019/03/07- 速讯:DeepSeek新模型曝光?“MODEL1”现身2026-01-22
- PriceSeek重点提醒:乌兰察布铁合金产业产2026-01-21
- 百利科技:拟投资2000万元设立控股子公司2026-01-21
- 【圣洁甘孜·相约一生】从松茸产业到清洁能2026-01-21
- 海泰科:可以为电场储能柜中的“液流框”等2026-01-21
- 每日看点!湘财证券2025年净利倍增,合并大2026-01-21
- 亞姐蘇原修行十年歸來,《一心渡》國際發布2026-01-21
- 公用建筑题材的上市公司名单(1月21日) 2026-01-21
- 爱旭中标百色能源新型电力系统调度运行监测2026-01-21
- 盘点!2026年车饰股票的龙头股,名单合集!2026-01-21
- 无锡市骊行汽车科技有限公司成立 注册资本2026-01-21
- 西安、郑州超过成都、重庆,中欧班列格局何2026-01-20
- 时讯:河南省方城县:科技赋能激活现代农业2026-01-20
- 凯龙高科:拟购买深圳市金旺达机电有限公司2026-01-20
- 每日热议!以雪为令迎战强寒潮 交通一线守2026-01-20
- 当前热点小米汽车公布车载多连屏显示相关专2026-01-20
- 最美不是雪景 是雪中的人 焦点速读2026-01-20
- 观天下!新华社权威快报丨规模5000亿元!民2026-01-20
- 西安护城河水系70余年后首次全线贯通 新资讯2026-01-20
- 今日發行-2026版中國龍銀質紀念幣2026-01-20
- 合肥之阅医疗器械有限公司成立 注册资本502026-01-20
- 前沿资讯!破140万亿元!5%!数读2025中国经2026-01-19
- 三大核能核电概念龙头股,名单收好(2026/12026-01-19
- 深夜emo后如何见人?一篇搞定熬夜肌急救指2026-01-19
- 焦点快报!生意社:2026年1月19日主流环氧乙2026-01-19
- 阆中至营山通勤将缩至40分钟 嘉陵江特大桥2026-01-19
- 4寸蛋糕只要10元!乡村蛋糕店意外爆火,老2026-01-19
- 增长5%!2025年中国GDP跨越140万亿元关口|视点2026-01-19
- 速看:神舟二十号飞船返回任务取得圆满成功2026-01-19
- 山子高科在海南成立新公司,含金属矿石业务2026-01-19


