Web Analytics

اینتل با Gaudi2 بازار مراکز داده را هدف قرار داده است

اینتل می‌گوید شتاب‌دهنده Gaudi2 چیزی بیش از یک رقیب برای انویدیا A100 است
اینتل می‌گوید شتاب‌دهنده Gaudi2 چیزی بیش از یک رقیب برای انویدیا A100 است
آی تی جو بستری جهت درج تبلیغات دانش محور محصولات شما

اینتل رقابتی را بین شتاب‌دهنده جدید Gaudi2 خود و انویدیا A100 پیشتاز دو ساله بازار ایجاد کرده است. در دو بنچمارک مناسب با جایگاه خود، شتاب‌دهنده جدید از رقیب خود انویدیا پیشی می‌گیرد.

Gaudi2 توسط شرکت هابانا لبز – Habana Labs که اینتل آن را در پایان سال 2019 به قیمت 2 میلیارد دلار خریداری کرد، ساخته شده است. هابانا در واقع دو نوع شتاب‌دهنده تخصصی مرکز داده می‌سازد: یک سری برای آموزش شبکه‌های عصبی مانند Gaudi2 و نوع دوم برای اجرا (یعنی استنتاج) آن‌ها، مانند Goya و Greco.

مقایسه کارایی Gaudi2 و A100

هابانا و اینتل Gaudi2 را در ماه اردیبهشت رونمایی کردند، اما تا هفته گذشته منتظر ماندند تا امتیازات بنچمارک خود را در پایگاه داده عمومی MLPerf بارگذاری کنند. آن‌ها در نمودارهای خود، امتیازات سیستم Gaudi2 خود را با امتیازات عمومی سیستم‌های مجهز به A100 از انویدیا و دل مقایسه می‌کنند.

بنچمارک ResNet-50 توانایی سخت‌افزار برای آموزش هوش مصنوعی به منظور طبقه‌بندی تصاویر را آزمایش می‌کند. سیستم هابانا Gaudi2 فقط 18 دقیقه طول کشید تا هوش مصنوعی را به خوبی آموزش دهد و بتواند آزمایش را پشت سر بگذارد و با این رکورد به راحتی از سیستم انویدیا A100 که تقریباً نیم ساعت زمان نیاز داشت، پیشی گرفت.

نتایج مقایسه شتابدهنده اینتل و انویدیا در بنچمارک ResNet-50
نتایج مقایسه شتابدهنده اینتل و انویدیا در بنچمارک ResNet-50

در بنچمارک دیگر، سیستم Gaudi2 هابانا فقط 17 دقیقه طول کشید تا مدل BERT را آموزش دهد و زمان سیستم A100 انویدیا را حدود یک دقیقه شکست دهد. BERT یک مدل پردازش زبان طبیعی است و در این آزمون خود را با مقالات ویکی‌پدیا آموزش می‌دهد.

نتایج مقایسه شتابدهنده اینتل و انویدیا در بنچمارک BERT
نتایج مقایسه شتابدهنده اینتل و انویدیا در بنچمارک BERT

برای هر دو بنچمارک، سیستم‌ها از هشت هسته شتاب‌دهنده/GPU استفاده کردند. همچنین سیستم هابانا آن‌ها را با یک جفت CPU 40 هسته‌ای اینتل زئون 8380 و انویدیا ‌آن‌ها را با دو CPU  64 هسته‌ای AMD اپیک 7742 اجرا کرد.

مشخصات فنی Gaudi2

Gaudi2 دارای 24 TPC (هسته‌های پردازشگر تانسور) و دو MME (موتورهای ضرب ماتریس) است که تا حدی به صورت موازی کار می‌کنند. به این ترتیب مجموعه گسترده‌ای از انواع داده‌ها، از جمله FP32، TF32، BF16، FP16 و FP8 را پشتیبانی می‌کند. این محصول همچنین دارای یک موتور رسانه‌ای اختصاصی برای پردازش رسانه‌های صوتی و تصویری به عنوان ورودی است.

در مورد حافظه، Gaudi2 دارای شش استک 16 گیگابایتی HBM2e است که مجموعاً 96 گیگابایت و 2.45 ترابایت بر ثانیه از کل پهنای باند حافظه را شامل می‌شود. داخل آن یک کش 48 مگابایتی دارد. برای اتصال، از یک اتصال x16 PCIe 4.0 استفاده می‌کند و دارای 24 پورت RoCE2 100 مگابیت بر ثانیه است.

رقابت در بازار شتاب‌دهنده‌های مراکز داده

هابانا به وضوح یک رقیب واقعی A100 را به اینتل هدیه کرده است. با توجه به اینکه انویدیا H100 را سه ماه پیش معرفی کرد، زمان‌بندی آن می‌توانست بهتر باشد، اما این دو محصول به قدری متفاوت هستند که علیرغم رقابت در بنچمارک‌ها، ممکن است عملاً برای اسلات مادربردها رقابت نکنند.

در حالی که A100 و H100 غول‌های همه‌کاره هستند، Gaudi2 یک شتاب‌دهنده ساده است که تلاش می‌کند کاری متفاوت انجام دهد، و دیدن موفقیت یا عدم موفقیت آن بسیار جذاب خواهد بود!