字节跳动开源大模型训练框架_小九直播间足球直播世界杯

行业新闻

字节跳动开源大模型训练框架

类别：行业新闻来源：小九直播间足球直播世界杯发布时间：2023-12-24 02:05:39 浏览：1

近日，字节跳动应用机器学习团队开源veGiantModel大模型训练框架。

该训练框架主要使用在于自然语言处理领域的大模型训练，最高可将大模型训练的性能提升6.9倍，大幅度降低训练系统的压力。字节跳动旗下的企业级技术服务平台火山引擎已在其机器学习平台上原生支持了veGiantModel，该平台正在公测中。

自然语言处理是人工智能研究的一个重要领域，旨在帮助计算机理解、解释和运用人类语言，可应用于机器翻译、个性化推荐和信息提取等领域。近些年，自然语言处理在应用方面取得了较为明显的突破，主要归功于深度学习以及有关技术的发展，尤其是Bert、GPT、GPT-3等大规模预训练语言模型的普及。

大规模训练模型可以包含更多数据，表示更多详细的信息，算法表现更加出众。然而，由于大模型参数量过于庞大，模型设计很复杂，训练耗时长，对现有的训练系统带来了不小的挑战，大多数表现为显存压力、计算压力和通信压力。

针对现有训练系统在大模型训练场景下的上述挑战，字节跳动应用机器学习团队提出了大模型训练框架veGiantModel。

与主流开源训练框架的对比测试显示，veGiantModel的性能表现最好、受网络带宽影响最小，在Tesla V100上较上述两者有1.2倍到3.5倍的提升，在Ampere A100上最高可提升6.9倍，能大幅度降低训练系统的压力。

近年来，字节跳动持续推动技术开源。2021年，字节跳动技术团队陆续开源了微服务中间件CloudWeGo、LightSeq训练加速引擎等30余个重要项目。

字节跳动有关技术负责这个的人说，推广科学技术创新成果的应用并推行技术开源一直是公司所倡导的，技术团队将持续通过科学技术创新为行业发展提供更多动力，助力科技更好地造福社会。

封面新闻丨2023世界智能制造大会提供 “演武场”，300款工业机器人齐上阵