超级计算集群结合ACK实现NLP训练

直达最佳实践:【超级计算集群结合ACK实现NLP训练
最佳实践频道:【点击查看更多上云最佳实践

这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求!

场景描述

本方案适用于自然语言处理的训练场景,使用神龙GPU云服务器(SCCGN6)+CPFS+容器服务Kubernetes版(ACK)进行NLP的训练,采用Bert模型,使用飞天AI加速训练工具可以有效提升多机多卡的训练效率。

解决问题

  • 使用神龙+ACK搭建NLP训练环境。
  • 使用SCC的RDMA网络
  • 使用CPFS存储训练数据
  • 使用飞天AI加速训练工具加速训练

产品列表

  • 神龙GPU云服务器(SCCGN6)
  • 容器服务Kubernetes版(ACK)
  • SCC超级计算集群
  • CPFS共享存储

超级计算集群结合ACK实现NLP训练

直达最佳实践 》》

超级计算集群结合ACK实现NLP训练

上一篇:Unity使用中的错误 ✨使用unity过程中碰到的一些错误及解决


下一篇:项目中使用ES6中数组解构与深拷贝浅拷贝关系