直达最佳实践:【超级计算集群结合ACK实现NLP训练】
最佳实践频道:【点击查看更多上云最佳实践】
这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求!
场景描述
本方案适用于自然语言处理的训练场景,使用神龙GPU云服务器(SCCGN6)+CPFS+容器服务Kubernetes版(ACK)进行NLP的训练,采用Bert模型,使用飞天AI加速训练工具可以有效提升多机多卡的训练效率。
解决问题
- 使用神龙+ACK搭建NLP训练环境。
- 使用SCC的RDMA网络
- 使用CPFS存储训练数据
- 使用飞天AI加速训练工具加速训练
产品列表
- 神龙GPU云服务器(SCCGN6)
- 容器服务Kubernetes版(ACK)
- SCC超级计算集群
- CPFS共享存储