查看原文
其他

腾讯云推出最新训练框架,以2分31秒打破ImageNet业界训练记录

特大牛 2022-07-03
近日,腾讯云正式对外宣布成功创造了128卡训练ImageNet业界新记录,以2分31秒的成绩一举刷新了这个领域的世界记录

若改变跨机网络带宽,该成绩还可以进一步提升至2分2秒,将这一记录提升到一个全新的高度


这次记录是基于公有云25Gbps的VPC网络环境,使用128块V100 GPU,并借助最新研制的Light大规模分布式多机多卡训练框架创造的,最终成绩定格在2分31秒训练 ImageNet 28个epoch,TOP5精度达到93%,之前的业界最好成绩是2分38秒。

据了解,Light大规模分布式多机多卡训练框架由腾讯云智能钛团队、腾讯机智团队、腾讯优图实验室以及香港浸会大学计算机科学系褚晓文教授团队等多个团队合作研发推出,该框架从深度学习训练的速度、多机多卡的扩展性、batch收敛等方面,为业界提供了一套全新的训练解决方案

通过 Light大规模分布式多机多卡训练框架及平台等一系列完整的解决方案,ImageNet的训练结果取得了新突破。并且在取得高效训练的同时,也将其能力集成到腾讯云智能钛机器学习平台,并广泛应用在腾讯内外部的业务。

接下来,联合项目团队还将进一步提升机器学习平台易用性,训练和推理性能,构建稳定、易用、好用、高效的平台和服务,为算法工程师提供有力的机器学习工具,助力各行各业用户业务的发展。








腾讯云曝光“云原生产品布局图”

亮点多多,腾讯云TBase数据库开源后首次重磅升级

腾讯云发布企业级数据库迁移产品—DBbridge

腾讯云推出自研数据中心开放光网络传输设备

腾讯云发布国内首款Serverless数据库!部署1秒,成本降70%



欢迎新闻投稿特大牛平台入驻企业优先发布email:tdm@itxxxl.com


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存