اینتل رقابتی را بین شتابدهنده جدید Gaudi2 خود و انویدیا A100 پیشتاز دو ساله بازار ایجاد کرده است. در دو بنچمارک مناسب با جایگاه خود، شتابدهنده جدید از رقیب خود انویدیا پیشی میگیرد.
Gaudi2 توسط شرکت هابانا لبز – Habana Labs که اینتل آن را در پایان سال 2019 به قیمت 2 میلیارد دلار خریداری کرد، ساخته شده است. هابانا در واقع دو نوع شتابدهنده تخصصی مرکز داده میسازد: یک سری برای آموزش شبکههای عصبی مانند Gaudi2 و نوع دوم برای اجرا (یعنی استنتاج) آنها، مانند Goya و Greco.
مقایسه کارایی Gaudi2 و A100
هابانا و اینتل Gaudi2 را در ماه اردیبهشت رونمایی کردند، اما تا هفته گذشته منتظر ماندند تا امتیازات بنچمارک خود را در پایگاه داده عمومی MLPerf بارگذاری کنند. آنها در نمودارهای خود، امتیازات سیستم Gaudi2 خود را با امتیازات عمومی سیستمهای مجهز به A100 از انویدیا و دل مقایسه میکنند.
بنچمارک ResNet-50 توانایی سختافزار برای آموزش هوش مصنوعی به منظور طبقهبندی تصاویر را آزمایش میکند. سیستم هابانا Gaudi2 فقط 18 دقیقه طول کشید تا هوش مصنوعی را به خوبی آموزش دهد و بتواند آزمایش را پشت سر بگذارد و با این رکورد به راحتی از سیستم انویدیا A100 که تقریباً نیم ساعت زمان نیاز داشت، پیشی گرفت.
در بنچمارک دیگر، سیستم Gaudi2 هابانا فقط 17 دقیقه طول کشید تا مدل BERT را آموزش دهد و زمان سیستم A100 انویدیا را حدود یک دقیقه شکست دهد. BERT یک مدل پردازش زبان طبیعی است و در این آزمون خود را با مقالات ویکیپدیا آموزش میدهد.
برای هر دو بنچمارک، سیستمها از هشت هسته شتابدهنده/GPU استفاده کردند. همچنین سیستم هابانا آنها را با یک جفت CPU 40 هستهای اینتل زئون 8380 و انویدیا آنها را با دو CPU 64 هستهای AMD اپیک 7742 اجرا کرد.
مشخصات فنی Gaudi2
Gaudi2 دارای 24 TPC (هستههای پردازشگر تانسور) و دو MME (موتورهای ضرب ماتریس) است که تا حدی به صورت موازی کار میکنند. به این ترتیب مجموعه گستردهای از انواع دادهها، از جمله FP32، TF32، BF16، FP16 و FP8 را پشتیبانی میکند. این محصول همچنین دارای یک موتور رسانهای اختصاصی برای پردازش رسانههای صوتی و تصویری به عنوان ورودی است.
در مورد حافظه، Gaudi2 دارای شش استک 16 گیگابایتی HBM2e است که مجموعاً 96 گیگابایت و 2.45 ترابایت بر ثانیه از کل پهنای باند حافظه را شامل میشود. داخل آن یک کش 48 مگابایتی دارد. برای اتصال، از یک اتصال x16 PCIe 4.0 استفاده میکند و دارای 24 پورت RoCE2 100 مگابیت بر ثانیه است.
رقابت در بازار شتابدهندههای مراکز داده
هابانا به وضوح یک رقیب واقعی A100 را به اینتل هدیه کرده است. با توجه به اینکه انویدیا H100 را سه ماه پیش معرفی کرد، زمانبندی آن میتوانست بهتر باشد، اما این دو محصول به قدری متفاوت هستند که علیرغم رقابت در بنچمارکها، ممکن است عملاً برای اسلات مادربردها رقابت نکنند.
در حالی که A100 و H100 غولهای همهکاره هستند، Gaudi2 یک شتابدهنده ساده است که تلاش میکند کاری متفاوت انجام دهد، و دیدن موفقیت یا عدم موفقیت آن بسیار جذاب خواهد بود!