زیرساخت هوش مصنوعی گوگل کلود با TPUهای تریلیوم بهبود می‌یابد

TPUهای جدید گوگل با نام تریلیوم عملکرد قابل توجهی در سرعت آموزش و استنتاج هوش مصنوعی ارائه می‌دهند

گوگل کلود اخیراً به‌روزرسانی‌های قابل توجهی در زیرساخت هوش مصنوعی خود اعلام کرد و سخت‌افزار و راهکارهای نرم‌افزاری پیشرفته‌ای را برای پاسخگویی به نیازهای روزافزون بارهای کاری هوش مصنوعی معرفی نمود. نقطه کانونی این ارتقا، TPU تریلیوم، نسل ششم واحد پردازش تنسور (TPU) از شرکت گوگل است.

TPU چیست؟

‏TPU یا واحد پردازش تنسور (Tensor Processing Unit) در واقع تراشه‌ای است که توسط گوگل برای سرعت بخشیدن به محاسبات هوش مصنوعی، به‌ویژه در یادگیری ماشین و اجرای مدل‌های یادگیری عمیق، طراحی شده است.

با ادغام TPUهای تریلیوم و GPUهای انویدیا، گوگل کلود قابلیت‌های هوش مصنوعی خود را بهبود بخشیده تا در عرصه محاسبات هوش مصنوعی رقابت کند. این پیشرفت‌های جدید به دنبال ساده‌سازی توسعه و پیاده‌سازی مدل‌های پیچیده هوش مصنوعی در صنایع گوناگون هستند.

TPU تریلیوم در مقایسه با TPU v5e قبلی، بیش از چهار برابر سرعت آموزش و تا سه برابر سرعت استنتاج را به همراه دارد و کارایی انرژی را نیز ۶۷ درصد افزایش می‌دهد.

TPU تریلیوم با مشخصات قابل توجهی عرضه می‌شود که شامل دو برابر شدن ظرفیت حافظه پهنای باند بالا (HBM) و پهنای باند اتصال بین تراشه‌ای (ICI) است و آن را برای پردازش مدل‌های بزرگ زبانی مانند Gemma 2 و Llama و همچنین برای انجام وظایف سنگین استنتاجی نظیر مدل‌هایی مانند استیبل دیفیوژن XL مناسب می‌سازد.

یکی از ویژگی‌های برجسته TPU تریلیوم، قابلیت مقیاس‌پذیری آن است. هر پاد با پهنای باند بالا و تأخیر کم می‌تواند تا ۲۵۶ تراشه تریلیوم را پشتیبانی کند و صدها پاد می‌توانند به هم متصل شوند تا یک شبکه در مقیاس ابررایانه را تشکیل دهند که از طریق زیرساخت شبکه دیتاسنتر گوگل با ظرفیت ۱۳ پتابیت در ثانیه به هم متصل می‌شوند. نرم‌افزار Multislice در TPU تریلیوم همچنین از مقیاس‌بندی تقریباً خطی در میان این کلاستر‌های عظیم پشتیبانی می‌کند.

آزمون‌های بنچمارک، توانمندی‌های تریلیوم را برجسته می‌کنند: سرعت آموزش مدل‌هایی مانند Gemma 2-27b، MaxText Default-32b، و Llama2-70B بیش از چهار برابر سریع‌تر از TPU v5e است و سرعت استنتاج برای استیبل دیفیوژن XL نیز سه برابر شده است.

گوگل کلود علاوه بر تریلیوم، از ماشین‌های مجازی A3 Ultra مجهز به GPUهای H200 Tensor Core محصول انویدیا رونمایی کرد. این ماشین‌های مجازی که ماه آینده در نسخه پیش‌نمایش عرضه می‌شوند، پهنای باند شبکه دو برابری بین GPUها نسبت به ماشین‌های مجازی A3 Mega ارائه می‌دهند.

ماشین‌های مجازی A3 Ultra با تقریباً دو برابر ظرفیت حافظه و ۱/۴ برابر پهنای باند بیشتر نسبت به A3 Mega برای بهینه‌سازی وظایف استنتاج مدل‌های بزرگ زبانی طراحی شده‌اند و از طریق «گوگل کوبرنیتز انجین» قابل دسترسی خواهند بود.

گوگل کلود همچنین کلاستر‌های «هایپر کامپیوت» را معرفی کرده است؛ سیستمی قدرتمند که مدیریت زیرساخت هوش مصنوعی در مقیاس بزرگ را ساده می‌سازد و به مشتریان این امکان را می‌دهد که هزاران شتاب‌دهنده را به‌عنوان یک سیستم واحد و یکپارچه مدیریت کنند.

برنامه ساعت هوشمند: راهنمای جامع نصب و استفاده از اپلیکیشن‌های برتر

چین در نوآوری تکنولوژی گوی سبقت را از کره و ژاپن ربوده است

راهنمای خرید بهترین پاور سرور برای کسب‌وکارهای بزرگ

5 اشتباه رایج که موقع خرید ساعت هوشمند طرح اپل واچ نباید انجام بدید!

کپ کات بهترین برنامه ادیت با موبایل + دانلود نسخه بدون مشکل

تفاوت بین داکت برق و ترانک شبکه در چیست؟

تبلیغات گوگل برای رویدادها: جذب ثبت‌نام‌کنندگان از طریق Search

بهترین راه برای جذب مشتریان جدید با شماره‌جو اینباکسینو

مقایسه هایما S7 با جک S5

مقایسه Gemini و ChatGPT: کدام یک بهتر است؟

چگونه از قفل شدن خودکار ویندوز 11 یا ویندوز 10 جلوگیری کنیم؟

افزونه‌ی جستجوی ChatGPT برای گوگل کروم معرفی شد

هوش مصنوعی پرپلکیسیتی به قابلیت‌های جدیدی مجهز می‌شود

راهنمای خرید دوربین ثبت وقایع خودرو

چگونه حساب جیمیل هک شده را بازیابی کنیم؟

با ۱۰ ویژگی اولیه هوش اپل (Apple Intelligence) آشنا شوید

داک‌داک‌گو چیست؟

بررسی بازی‌های ایردراپ تلگرام

هوش مصنوعی هنوز نمی‌تواند جایگزین جستجوی گوگل شود

تاریخچه یادگیری ماشین (Machine Learning)