AI芯片格局生变:国产品牌占据“半壁江山”,黄仁勋:中国市场已让给华为
不过,由于受美国制裁影响,华为无法获取先进制程工艺,只能转向中芯国际N+1工艺,来维持产品迭代,并推出昇腾910B/910C。
由于单颗芯片性能受限,华为选择通过规模化系统设计,成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中展现更强竞争力。
去年5月的鲲鹏昇腾开发者大会上,华为推出了昇腾超节点技术,并发布AI算力集群解决方案CloudMatrix 384,成功实现业界最大规模的384卡高速总线互联。
据了解,昇腾384超节点搭载了384颗昇腾910C AI芯片,可提供高达300 PFLOPs的密集BF16算力,接近英伟达GB200 NVL72系统的两倍,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍。
去年9月,华为AI芯片宣布恢复正常更新节奏。徐直军在全联接大会上首次对外公布了华为昇腾AI芯片未来三年的产品迭代路线图——以每年一迭代的节奏,陆续推出昇腾950、昇腾960、昇腾970系列芯片。
在最近举行的鲲鹏昇腾开发者大会上,华为也展示了昇腾950超节点单柜实机。据了解,Atlas 950超节点最大支持8192张昇腾950DT卡,这将是昇腾384超节点的20多倍。
昇腾950超节点的算力规模也将明显提升,其中FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。这个数字意味着,Atlas 950一个产品的总互联带宽,已经是今天全球互联网峰值带宽的10倍有余。