模型的計算量 ,冠軍還可以降低訪存量,冠軍提高了模型訓(xùn)練時對算力的利用率 ,以及推理時的吞吐量 。在多維并行親和方面,采用數(shù)量為的指數(shù)級的專家數(shù)量 ,達成了×超融合并行的方式