گوگل کلود اخیراً بهروزرسانیهای قابل توجهی در زیرساخت هوش مصنوعی خود اعلام کرد و سختافزار و راهکارهای نرمافزاری پیشرفتهای را برای پاسخگویی به نیازهای روزافزون بارهای کاری هوش مصنوعی معرفی نمود. نقطه کانونی این ارتقا، TPU تریلیوم، نسل ششم واحد پردازش تنسور (TPU) از شرکت گوگل است.
TPU چیست؟
TPU یا واحد پردازش تنسور (Tensor Processing Unit) در واقع تراشهای است که توسط گوگل برای سرعت بخشیدن به محاسبات هوش مصنوعی، بهویژه در یادگیری ماشین و اجرای مدلهای یادگیری عمیق، طراحی شده است.
با ادغام TPUهای تریلیوم و GPUهای انویدیا، گوگل کلود قابلیتهای هوش مصنوعی خود را بهبود بخشیده تا در عرصه محاسبات هوش مصنوعی رقابت کند. این پیشرفتهای جدید به دنبال سادهسازی توسعه و پیادهسازی مدلهای پیچیده هوش مصنوعی در صنایع گوناگون هستند.
TPU تریلیوم در مقایسه با TPU v5e قبلی، بیش از چهار برابر سرعت آموزش و تا سه برابر سرعت استنتاج را به همراه دارد و کارایی انرژی را نیز ۶۷ درصد افزایش میدهد.
TPU تریلیوم با مشخصات قابل توجهی عرضه میشود که شامل دو برابر شدن ظرفیت حافظه پهنای باند بالا (HBM) و پهنای باند اتصال بین تراشهای (ICI) است و آن را برای پردازش مدلهای بزرگ زبانی مانند Gemma 2 و Llama و همچنین برای انجام وظایف سنگین استنتاجی نظیر مدلهایی مانند استیبل دیفیوژن XL مناسب میسازد.
یکی از ویژگیهای برجسته TPU تریلیوم، قابلیت مقیاسپذیری آن است. هر پاد با پهنای باند بالا و تأخیر کم میتواند تا ۲۵۶ تراشه تریلیوم را پشتیبانی کند و صدها پاد میتوانند به هم متصل شوند تا یک شبکه در مقیاس ابررایانه را تشکیل دهند که از طریق زیرساخت شبکه دیتاسنتر گوگل با ظرفیت ۱۳ پتابیت در ثانیه به هم متصل میشوند. نرمافزار Multislice در TPU تریلیوم همچنین از مقیاسبندی تقریباً خطی در میان این کلاسترهای عظیم پشتیبانی میکند.
آزمونهای بنچمارک، توانمندیهای تریلیوم را برجسته میکنند: سرعت آموزش مدلهایی مانند Gemma 2-27b، MaxText Default-32b، و Llama2-70B بیش از چهار برابر سریعتر از TPU v5e است و سرعت استنتاج برای استیبل دیفیوژن XL نیز سه برابر شده است.
گوگل کلود علاوه بر تریلیوم، از ماشینهای مجازی A3 Ultra مجهز به GPUهای H200 Tensor Core محصول انویدیا رونمایی کرد. این ماشینهای مجازی که ماه آینده در نسخه پیشنمایش عرضه میشوند، پهنای باند شبکه دو برابری بین GPUها نسبت به ماشینهای مجازی A3 Mega ارائه میدهند.
ماشینهای مجازی A3 Ultra با تقریباً دو برابر ظرفیت حافظه و ۱/۴ برابر پهنای باند بیشتر نسبت به A3 Mega برای بهینهسازی وظایف استنتاج مدلهای بزرگ زبانی طراحی شدهاند و از طریق «گوگل کوبرنیتز انجین» قابل دسترسی خواهند بود.
گوگل کلود همچنین کلاسترهای «هایپر کامپیوت» را معرفی کرده است؛ سیستمی قدرتمند که مدیریت زیرساخت هوش مصنوعی در مقیاس بزرگ را ساده میسازد و به مشتریان این امکان را میدهد که هزاران شتابدهنده را بهعنوان یک سیستم واحد و یکپارچه مدیریت کنند.