时间:2025/1/26 13:42:19来源:www.pc6.com作者:清晨我要评论(0)
【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。
最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。
OLMo2系列包含7B和13B两个型号,相比如Llama3.1和Qwen2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。
不同大小开源模型的性能对比,OLMo2的表现优于同参数规模模型
在多个下游任务上,OLMo2展现出了强大的泛化能力和适应能力。在10个基准上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基准均分也超过了Llama-3.1-8B。
训练过程全公开
不同于Llama、Qwen这类只开源模型权重的项目,这次AI2也秉持了一贯的开源风格,即不止发布了训练好的OLMo2模型权重,还公开了训练数据、代码、训练过程。这无疑为之后的LLM的研究和应用提供了宝贵的资源。
论文地址:https://arxiv.org/pdf/2501.00656
OLMo2的训练过程分为3个阶段,分别是预训练、中期训练和后期的指令调优。预训练数据混合了高质量的网页数据、代码数据和学术论文数据等。
在预训练阶段,OLMo2通过多种技术改进了训练稳定性,例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增,从而提高了最终模型的性能。
预训练使用的高质量数据集
中期训练阶段使用高质量的领域特定数据(例如数学数据),以及合成数据,来增强模型的能力,特别是在数学任务上的表现;加上微退火技术评估以及选择高质量的数据源,进一步优化了中期训练的效果。
中期训练使用的高质量数据集
最后的指令调优阶段,研究人员基于Tülu3的指令调优方法,开发了OLMo2-Instruct模型,专注于使用许可数据,并扩展最终阶段的强化学习与可验证奖励(RLVR)。
此外,监督微调(SFT)、直接偏好优化(DPO)和RLVR等多阶段训练,显著提高了模型的指令跟随能力和生成质量。
OLMo2的开源是全方位的,包括所有用于复制和扩展这些模型所需的训练和评估代码、数据集、模型检查点、日志及超参数的选择等,相比只开源权重,使更多研究人员和开发者能够使用和改进这些模型。
通过开源所有组件,OLMo2促进了对语言模型行为和使用的理解和研究,促进语言模型研究的透明度和可重复性,这些足以成为之后研究所依赖的基础设施。
OLMo27B和13B模型的训练过程中的超参数
多管齐下造就「低碳」LLM
在大规模语言模型训练中,计算资源和环境影响是不可忽视的因素。Deepseek V3能够以20分之一的成本进行训练,而OLMo2团队也通过减少主机-设备同步、数据预处理、数据缓存等多种方法降低了训练成本,并取得了显著的成效。
OLMo2的训练主要在两个集群上进行:Jupiter和Augusta。Jupiter集群配备了128个节点,每个节点有8张H100,总共1024个GPU;Augusta集群由160个A3Mega虚拟机组成,每个虚拟机也有8张H100,总共1280个GPU。
OLMo2的7B模型在4.05万亿token上进行训练,13B模型在5.6万亿token上进行训练。训练时间取决于模型的参数规模和训练数据量。
同时为了降低能源消耗,团队使用水冷系统来降低GPU的温度和功耗,从而提高训练效率并降低电力成本。
这些措施加在一起,相比训练同大小的Llama3.1所消耗的1022MWh电力,OLMo27B训练过程中总计只消耗了131MWh的电力,相当于只有约10分之一的耗电量,显著降低了训练过程消耗的算力,能源及碳足迹。
OLMo 和Llama训练能耗的对比
OLMo2的发布,标志着开源LLM的持续进步,为相关领域的研究建立一个新生态系统。在这个生态系统中,新的训练方法和技术需要被理解和分享。
相关视频
相关阅读 苦等7年果粉欢呼!微信CallKitt功能意外回归:支持灵动岛显示给AI一个机会,他还你一个颠覆式组织结开发者成功在Xbox 360上运行Llama语言模型,挑战老旧硬件极限三星透露其Ballie AI 机器人将于今年发布Apple Intelligence占用空间暴涨,AI功能让存储和电池成负担两部短剧付费8000万后,奇树有鱼决定All in免费“微信送礼”重燃战火,电商格局迎来新变数?“抖品牌”花千万重押代言人,赵露思、成毅、檀健次能否改写竞争
热门文章 AI 编程工具 StackBli扎克伯格宣布将一站式AI创作工具Refl司机都下岗的节奏!黄
最新文章
颠覆LLM格局,AI2新模体验完这个AI的新功能
三星宣布与谷歌联手研发AR眼镜AI 编程工具 StackBlitz 即将融资,估值达 OpenAI率先打样,今年AI圈的主角是智能体国产推理大模型决战2025考研数学,看看谁第
人气排行 安卓模拟器BlueStacks安装使用教程编程语言排行榜2020年9月 TIOBE编程语言排行eclipse字体大小怎么设置 eclipse字体大小plsql developer怎么连接数据库 plsql deveTomcat9.0安装教程 Tomcat9.0环境变量配置方plsql developer怎么使用 plsql developerVisual Studio 2015环境搭建教程Eclipse优化设置教程 Eclipse优化设置技巧
查看所有0条评论>>