400 128 6709

行业新闻

Radical Numerics 开源 30B 参数 RND1

发布时间:2025-10-13点击次数:

ai 研究组织 radical numerics 推出了 rnd1-base,这是目前规模最大的开源扩散语言模型,总参数量高达30b,其中每次推理仅激活3b参数,依托稀疏专家混合(moe)架构实现高效计算。该模型不仅在多项基准测试中表现优异,还全面公开了模型权重、训练细节与推理代码,致力于推动扩散语言模型在后训练和推理优化方向的研究进程。

RND1-Base 的构建基于 Qwen3-30BA3B 这一自回归基础模型,通过连续的预训练过程顺利迁移到扩散式生成范式。迁移过程中引入了双向掩码机制以及分层学习率策略,有效保留原始模型的知识能力,并采用最大达8M token的大批量训练方式提升训练稳定性,最终在500B token的数据规模上完成预训练。这一方法避免了从头训练的巨大开销,展示了 Radical Numerics 在模型再利用方面的前沿探索。

不同于传统自回归模型逐token顺序生成文本的方式,RND1 将文本生成建模为类似图像去噪的扩散过程,能够并行地对完整序列进行逐步去噪优化,支持双向注意力结构。这种机制大幅增强了生成过程的可控性与灵活性,同时显著减少推理时间,尤其适用于需要深度逻辑推理和复杂代码生成的任务场景。

Radical Numerics 开源 30B 参数 RND1

在主流通用评测基准中,RND1-Base 展现出领先性能,超越此前开源的扩散语言模型如 Dream-7B 和 LLaDA-8B。具体表现为:MMLU 多任务语言理解得分 57.2%,GSM8K 数学推理达到 72.1%,MBPP 编程任务得分为 51.3%。这些结果覆盖了推理能力、STEM 领域及程序生成等多个维度,验证了其在继承自回归模型优势的基础上,成功发挥扩散架构的独特潜力。

Motiff妙多 Motiff妙多

Motiff妙多是一款AI驱动的界面设计工具,定位为“AI时代设计工具”

Motiff妙多 334 查看详情 Motiff妙多

得益于其稀疏激活设计,RND1-Base 在保持30B总参数规模的同时,仅动态调用3B活跃参数,极大提升了推理效率,具备良好的工业部署可行性。尽管当前版本尚未经过精细化后训练,在贪婪解码模式下偶有重复输出现象,但项目已集成 FlashInfer 与 SGLang 推理后端,为后续高性能推理迭代提供了坚实基础。

Radical Numerics 自称为面向未来的AI实验室,专注于打造可递归自我进化的AI系统。RND1 正是其实现“AI自主改进AI”愿景的关键一步——借助自动化AI研究平台,使模型本身参与下一代系统的优化设计。团队成员来自 DeepMind、Meta、Liquid 及斯坦福等世界顶级科研机构,致力于推动人工智能在科学发现与产业应用中的深层变革。

此次开源 RND1-Base 的核心目标是激发社区对扩散语言模型在推理加速与后训练技术上的深入探索。当前,语言领域的扩散模型正由实验探索迈向实际应用,尤其在长序列并行生成方面展现出独特优势。业界普遍认为,这一发布将促进更多自回归模型向扩散架构迁移的研究尝试,填补高效开源生成模型生态的重要空白。

以上就是Radical Numerics 开源 30B 参数 RND1的详细内容,更多请关注其它相关文章!


# 斯坦福  # 企业门户网站建设说明  # 旅游seo优化关键词  # seo路线  # 莱西网站优化优势  # 潜江农业网站推广哪个好  # 的整合营销推广方法包括  # 团风seo搜索推广机构  # 贺兰数字营销推广公司有哪些  # 苏州建设网站报价  # 河南百度推广营销中心  # 安全防护  # 人工智能  # 园区  # 美国  # 微软  # 帮你  # 这一  # 递归  # 开源  # qwen  # ai  # 后端 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 了解 AGI:智能的未来?  编程已死,AI 当立?教授公开“唱反调”:AI 还帮不了程序员  普渡机器人与变形金刚品牌合作,特别活动爆火,商品售罄!  华为昇腾AI原生支持30多种基础大模型,包括GPT  谷歌 Gmail“帮我写电子邮件”AI 功能开始向安卓和苹果设备推广  国家发改委组织工业机器人产业高质量发展现场会  五个IntelliJ IDEA插件,高效编写代码  马斯克的幽默“现实”:AR眼镜与20美元“增强现实”哪个真实?  人形机器人打开精密齿轮市场全新空间!受益上市公司梳理  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  烟台大学学生首次在全国大学生无人机航拍竞赛中获奖  应对算力挑战,亚马逊云科技发力AI基础设施建设  AIGC 风潮刮到游戏产业,巨人网络与阿里云达成“游戏 +AI ”合作  NVIDIA垄断AI市场90%份额:AMD性能追上80% 软件太不能打  OpenAI高管:AI能创造新的就业机会 但也会淘汰一些  生成式AI与云结合,机遇与挑战并存  推动综合能源服务高质量发展  Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  国内首款大尺寸仿鸵双足机器人“大圣”亮相,穿戴红色战袍  软通动力多项AI创新产品及应用亮相2025世界人工智能大会  今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告  AI时代,企业需要什么样的员工?  亚马逊确认今年不举办re:MARS人工智能大会  首届全国体育人工智能大会在首都体育学院召开  全场景智能车:智能无处不在|芯驰亮相世界人工智能大会  AI大举入侵内容行业,哪些上市*及动漫公司进行了布局?  无人机在电力巡检中的应用:全面解析高效巡检流程  人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”  AI进军债券交易,BondGPT来了!  英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练  创新全场景清洁方案!海尔商用机器人首发上市  AI连线 | 专访风平智能CEO林洪祥:让AI数字人拥有漂亮的外表和有趣的灵魂,安全问题是重要考量  GPT-4最全攻略来袭!OpenAI官方发布,六个月攒下来的使用经验都在里面了  静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!  ChatGPT设计出的第一个机器人来了!【附人工智能行业预测】  2025世界人工智能大会成功召开  两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏  微盟宣布联合腾讯云共建行业大模型:加快激活AI大模型智能应用  苹果头显降临,AI虚拟人的救星还是流星?  《爱康未来之夜嘉宾官宣,携手共赴AI未来》  DreamAvatar数字人使用教程  阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  软银、淡马锡、沙特阿美突击入股,“协作机器人第一股”节卡股份:强敌环伺,持续失血是常态  传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API  图灵奖得主Hinton:我已经老了,如何控制比人类更聪明的AI交给你们了  日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司