谷歌宣布推出Cloud TPU v5p,這是目前最強大的人工智慧加速器

谷歌宣布推出Cloud TPU v5p,這是目前最強大的人工智慧加速器

2023.12.19

谷歌今日宣布推出其新的大型語言模型Gemini,與此同時,該公司還推出了新的Cloud TPU v5p,這是其Cloud TPU v5e的更新版本,後者在今年早些時候已開始普及。一個v5p集群包含總共8,960個晶片,並搭載了谷歌迄今為止最快的互聯網絡,每個晶片最高達4,800 Gbps。

谷歌承諾這些晶片的速度顯著快於v4 TPU,這並不令人意外。團隊聲稱,v5p在浮點運算能力(FLOPS)上有2倍的提升,在高帶寬記憶體上有3倍的改進。這有點像是將新的Gemini模型與較舊的OpenAI GPT 3.5模型進行比較。畢竟,谷歌本身已經將技術水平推進到超越TPU v4。然而,在許多方面,v5e集群與v4集群相比略顯不足,每個v5e集群只有256個晶片,而v4集群則有4096個,每個v5e晶片的16位浮點性能總計為197 TFLOPs,相較之下v4晶片為275 TFLOPs。對於新的v5p,谷歌承諾最高可達459 TFLOPs的16位浮點性能,並由更快的互聯網絡支持。

谷歌表示,這一切意味著TPU v5p可以比TPU v4快2.8倍訓練像GPT3-175B這樣的大型語言模型,且更具成本效益(儘管TPU v5e雖然速度較慢,但實際上提供了比v5p更高的每美元相對性能)。

谷歌DeepMind和谷歌研究的首席科學家杰夫·迪恩寫道:“在我們早期使用中,谷歌DeepMind和谷歌研究觀察到,使用TPU v5p晶片進行LLM訓練工作負載的速度比我們的TPU v4世代快了2倍。”他還說:“對ML框架(JAX、PyTorch、TensorFlow)和編排工具的強大支持使我們能夠在v5p上更有效地擴展。隨著SparseCores第二代的推出,我們還看到了嵌入式重工作負載性能的顯著提升。TPU對於使我們最大規模的研究和工程努力能夠在像Gemini這樣的尖端模型上實現至關重要。”

新的TPU v5p目前尚未普遍可用,因此開發者將不得不聯繫他們的谷歌帳戶經理以列入名單。

相關文章