时间:2025/1/26 13:42:19来源:www.pc6.com作者:清晨我要评论(0)
【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。
最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。
OLMo2系列包含7B和13B两个型号,相比如Llama3.1和Qwen2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。
不同大小开源模型的性能对比,OLMo2的表现优于同参数规模模型
在多个下游任务上,OLMo2展现出了强大的泛化能力和适应能力。在10个基准上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基准均分也超过了Llama-3.1-8B。
训练过程全公开
不同于Llama、Qwen这类只开源模型权重的项目,这次AI2也秉持了一贯的开源风格,即不止发布了训练好的OLMo2模型权重,还公开了训练数据、代码、训练过程。这无疑为之后的LLM的研究和应用提供了宝贵的资源。
论文地址:https://arxiv.org/pdf/2501.00656
OLMo2的训练过程分为3个阶段,分别是预训练、中期训练和后期的指令调优。预训练数据混合了高质量的网页数据、代码数据和学术论文数据等。
在预训练阶段,OLMo2通过多种技术改进了训练稳定性,例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增,从而提高了最终模型的性能。
预训练使用的高质量数据集
中期训练阶段使用高质量的领域特定数据(例如数学数据),以及合成数据,来增强模型的能力,特别是在数学任务上的表现;加上微退火技术评估以及选择高质量的数据源,进一步优化了中期训练的效果。
中期训练使用的高质量数据集
最后的指令调优阶段,研究人员基于Tülu3的指令调优方法,开发了OLMo2-Instruct模型,专注于使用许可数据,并扩展最终阶段的强化学习与可验证奖励(RLVR)。
此外,监督微调(SFT)、直接偏好优化(DPO)和RLVR等多阶段训练,显著提高了模型的指令跟随能力和生成质量。
OLMo2的开源是全方位的,包括所有用于复制和扩展这些模型所需的训练和评估代码、数据集、模型检查点、日志及超参数的选择等,相比只开源权重,使更多研究人员和开发者能够使用和改进这些模型。
通过开源所有组件,OLMo2促进了对语言模型行为和使用的理解和研究,促进语言模型研究的透明度和可重复性,这些足以成为之后研究所依赖的基础设施。
OLMo27B和13B模型的训练过程中的超参数
多管齐下造就「低碳」LLM
在大规模语言模型训练中,计算资源和环境影响是不可忽视的因素。Deepseek V3能够以20分之一的成本进行训练,而OLMo2团队也通过减少主机-设备同步、数据预处理、数据缓存等多种方法降低了训练成本,并取得了显著的成效。
OLMo2的训练主要在两个集群上进行:Jupiter和Augusta。Jupiter集群配备了128个节点,每个节点有8张H100,总共1024个GPU;Augusta集群由160个A3Mega虚拟机组成,每个虚拟机也有8张H100,总共1280个GPU。
OLMo2的7B模型在4.05万亿token上进行训练,13B模型在5.6万亿token上进行训练。训练时间取决于模型的参数规模和训练数据量。
同时为了降低能源消耗,团队使用水冷系统来降低GPU的温度和功耗,从而提高训练效率并降低电力成本。
这些措施加在一起,相比训练同大小的Llama3.1所消耗的1022MWh电力,OLMo27B训练过程中总计只消耗了131MWh的电力,相当于只有约10分之一的耗电量,显著降低了训练过程消耗的算力,能源及碳足迹。
OLMo 和Llama训练能耗的对比
OLMo2的发布,标志着开源LLM的持续进步,为相关领域的研究建立一个新生态系统。在这个生态系统中,新的训练方法和技术需要被理解和分享。
相关视频
相关阅读 苦等7年果粉欢呼!微信CallKitt功能意外回归:支持灵动岛显示给AI一个机会,他还你一个颠覆式组织结开发者成功在Xbox 360上运行Llama语言模型,挑战老旧硬件极限三星透露其Ballie AI 机器人将于今年发布Apple Intelligence占用空间暴涨,AI功能让存储和电池成负担两部短剧付费8000万后,奇树有鱼决定All in免费“微信送礼”重燃战火,电商格局迎来新变数?“抖品牌”花千万重押代言人,赵露思、成毅、檀健次能否改写竞争
热门文章
AI 编程工具 StackBli
扎克伯格宣布将
一站式AI创作工具Refl
司机都下岗的节奏!黄
最新文章
颠覆LLM格局,AI2新模
体验完这个AI的新功能
三星宣布与谷歌联手研发AR眼镜AI 编程工具 StackBlitz 即将融资,估值达 OpenAI率先打样,今年AI圈的主角是智能体国产推理大模型决战2025考研数学,看看谁第
人气排行 安卓模拟器BlueStacks安装使用教程编程语言排行榜2020年9月 TIOBE编程语言排行eclipse字体大小怎么设置 eclipse字体大小plsql developer怎么连接数据库 plsql deveTomcat9.0安装教程 Tomcat9.0环境变量配置方plsql developer怎么使用 plsql developerVisual Studio 2015环境搭建教程Eclipse优化设置教程 Eclipse优化设置技巧
查看所有0条评论>>