2024年世界互联网大会今日在浙江乌镇开幕,腾讯获得全新设立的世界互联网大会杰出贡献奖—创新突破类。
据“腾讯”公众号介绍,腾讯Angel机器学习平台也获得了本年度世界互联网大会领先科技奖。
腾讯称,该奖项被视为科技行业的最高荣誉之一,在270个申报项目中,共有20个项目获奖。
评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。
据了解,突破主要在通信、效率、规模三方面实现。
通信:
从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。
效率:
自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。
规模:
实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。
腾讯Angel机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,整个过程可以分成三层,Angel会在中间层发挥作用。
其中,底层GPU、云服务器等计算硬件提供算力支持,中层是机器学习平台,负责处理数据、开发算法和执行训练任务,上层是训练好的大模型。
简单来说,Angel机器学习平台可以把一堆杂乱的数据经过清洗、训练、加工等工序,变成一个强大的大模型。