Web Analytics Made Easy - Statcounter

زیرساخت هوش مصنوعی گوگل کلود با TPUهای تریلیوم بهبود می‌یابد

TPUهای جدید گوگل با نام تریلیوم عملکرد قابل توجهی در سرعت آموزش و استنتاج هوش مصنوعی ارائه می‌دهند
تی پی یو تریلیوم گوگل - Google Trillium TPU

گوگل کلود اخیراً به‌روزرسانی‌های قابل توجهی در زیرساخت هوش مصنوعی خود اعلام کرد و سخت‌افزار و راهکارهای نرم‌افزاری پیشرفته‌ای را برای پاسخگویی به نیازهای روزافزون بارهای کاری هوش مصنوعی معرفی نمود. نقطه کانونی این ارتقا، TPU تریلیوم، نسل ششم واحد پردازش تنسور (TPU) از شرکت گوگل است.

با ادغام TPUهای تریلیوم و GPUهای انویدیا، گوگل کلود قابلیت‌های هوش مصنوعی خود را بهبود بخشیده تا در عرصه محاسبات هوش مصنوعی رقابت کند. این پیشرفت‌های جدید به دنبال ساده‌سازی توسعه و پیاده‌سازی مدل‌های پیچیده هوش مصنوعی در صنایع گوناگون هستند.

TPU تریلیوم در مقایسه با TPU v5e قبلی، بیش از چهار برابر سرعت آموزش و تا سه برابر سرعت استنتاج را به همراه دارد و کارایی انرژی را نیز ۶۷ درصد افزایش می‌دهد.

TPU تریلیوم با مشخصات قابل توجهی عرضه می‌شود که شامل دو برابر شدن ظرفیت حافظه پهنای باند بالا (HBM) و پهنای باند اتصال بین تراشه‌ای (ICI) است و آن را برای پردازش مدل‌های بزرگ زبانی مانند Gemma 2 و Llama و همچنین برای انجام وظایف سنگین استنتاجی نظیر مدل‌هایی مانند استیبل دیفیوژن XL مناسب می‌سازد.

مقایسه نسل پنجم و ششم تی پی یو های گوگل

یکی از ویژگی‌های برجسته TPU تریلیوم، قابلیت مقیاس‌پذیری آن است. هر پاد با پهنای باند بالا و تأخیر کم می‌تواند تا ۲۵۶ تراشه تریلیوم را پشتیبانی کند و صدها پاد می‌توانند به هم متصل شوند تا یک شبکه در مقیاس ابررایانه را تشکیل دهند که از طریق زیرساخت شبکه دیتاسنتر گوگل با ظرفیت ۱۳ پتابیت در ثانیه به هم متصل می‌شوند. نرم‌افزار Multislice در TPU تریلیوم همچنین از مقیاس‌بندی تقریباً خطی در میان این کلاستر‌های عظیم پشتیبانی می‌کند.

آزمون‌های بنچمارک، توانمندی‌های تریلیوم را برجسته می‌کنند: سرعت آموزش مدل‌هایی مانند Gemma 2-27b، MaxText Default-32b، و Llama2-70B بیش از چهار برابر سریع‌تر از TPU v5e است و سرعت استنتاج برای استیبل دیفیوژن XL نیز سه برابر شده است.

گوگل کلود علاوه بر تریلیوم، از ماشین‌های مجازی A3 Ultra مجهز به GPUهای H200 Tensor Core محصول انویدیا رونمایی کرد. این ماشین‌های مجازی که ماه آینده در نسخه پیش‌نمایش عرضه می‌شوند، پهنای باند شبکه دو برابری بین GPUها نسبت به ماشین‌های مجازی A3 Mega ارائه می‌دهند.

ماشین‌های مجازی A3 Ultra با تقریباً دو برابر ظرفیت حافظه و ۱/۴ برابر پهنای باند بیشتر نسبت به A3 Mega برای بهینه‌سازی وظایف استنتاج مدل‌های بزرگ زبانی طراحی شده‌اند و از طریق «گوگل کوبرنیتز انجین» قابل دسترسی خواهند بود.

گوگل کلود همچنین کلاستر‌های «هایپر کامپیوت» را معرفی کرده است؛ سیستمی قدرتمند که مدیریت زیرساخت هوش مصنوعی در مقیاس بزرگ را ساده می‌سازد و به مشتریان این امکان را می‌دهد که هزاران شتاب‌دهنده را به‌عنوان یک سیستم واحد و یکپارچه مدیریت کنند.