今日,国内知名内容社区小红书在AI开源界投下一枚重磅炸弹:正式开源其内部核心大模型训练引擎Relax。此举不仅标志着小红书全面入局AI底层基础设施赛道,也让国内AI技术圈多了一个不容忽视的顶级玩家,引发了开发者的热烈讨论与下载潮。
在人们的固有印象中,小红书更多是一家以内容推荐算法见长的应用层公司。然而,Relax引擎的开源彻底颠覆了这一认知。据悉,Relax是小红书基础模型团队过去两年来应对千亿级参数多模态模型训练挑战所自研的分布式训练框架。相比于目前主流的Megatron-LM等开源架构,Relax在显存管理和跨节点通信优化上做出了独特的工程创新,特别针对目前业界紧缺的算力集群进行了极为深度的并行效率调优。测试数据显示,在同等硬件规模下,Relax能将多模态预训练的吞吐量提升约15%至20%,并且大幅降低了训练中断的恢复时间成本。

