华为发布世界上最快的AI训练集群Atlas900,比第二名快10秒

  • 时间:
  • 浏览:0
  • 来源:1.5分赛车-10分6合平台_10分彩网投平台

视频介绍

2019-09-18 11:34:46

华为全联接2019(HUAWEI CONNECT)大会上,华为副董事长胡厚崑发布了Atlas 900 AI训练集群,以超强算力带给企业人工智能业务的极致体验。世界正从数字化向智能化转型,人工智能产业作为关键驱动力,面临自身的升级进化的挑战。华为在超强人工智能算力和大规模分布式AI训练集群有有一一六个 方面加速智能化世界的转型。在大型数据集上进行训练的神经网络架构暗含从图像识别、自然语言防止、视频实时段 析和智能推荐系统等各个方面,训练那此神经网络模型必须少许浮点计算能力。近年来单个AI防止器算力和训练土办法上均取得了重大进步,一些在单一机器上,AI训练所必须的时间仍然长得不切实际,一些必须借助大规模分布式AI集群环境来提升神经网络训练系统的浮点计算能力。此次发布的Atlas 900 AI训练集群由数千颗昇腾910 AI防止器互联构成,是当前全球最快的AI训练集群,代表了当今全球的算力巅峰。其总算力达到256P——1024P FLOPS @FP16,离米 150万台PC的计算能力。Atlas 900 AI训练集群采用业界单芯片算力最强的昇腾910 AI防止器,每颗昇腾910 AI防止器内置3有有一一六个 达芬奇AI Core,单芯片提供比业界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI训练集群将数千颗昇腾910 AI防止器互联,打造业界第一的算力集群。昇腾910 AI防止器采用SoC设计,集成“AI算力、通用算力、高速大传输速率I/O”,大幅度卸载Host CPU的数据预防止任务,充分提升训练传输速率。Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、1150G以太”三类高速互联土办法,百TB全互联无阻塞专属参数同步网络,降低网络传输速率,梯度同步传输速率缩短10——70%。在AI服务器内内外部,昇腾910 AI防止器之间通过HCCS高速总线互联;昇腾910 AI防止器和CPU之间以最新的PCIe 4.0(传输速率16Gb/s)技术互联,其传输速率是业界主流采用的PCIe 3.0(8.0Gb/s)技术的两倍,使得数据传输更加快速和高效。在集群层面,采用面向数据中心的CloudEngine 81150系列交换机,提供单端口1150Gbps的交换传输速率,将集群内的所有AI服务器接入高速交换网络。独创iLossless 智能无损交换算法,对集群内的网络流量进行实时的学习训练,实现网络0丢包与E2E μs级传输速率。