آمازون تلاش کرده تا وابستگی خود به انویدیا را در بازار پردازندههای هوش مصنوعی که ارزش آن به بیش از ۱۰۰ میلیارد دلار میرسد، کاهش دهد، اما به نظر نمیرسد که بتواند به این زودی آن را کنار بزند.
مهندسان آمازون در یک مجتمع اداری در شمال آستین، تگزاس، مشغول کار روی یکی از جاهطلبانهترین پروژههای صنعت فناوری هستند: توسعه چیپهای هوش مصنوعی سفارشی که میتوانند در برابر سلطه انویدیا در بازار پردازندههای هوش مصنوعی رقابت کنند. در میان میزهای کاری شلوغ و ابزارهای الکترونیکی، رویکرد عملی و دستساز این تیم، تفاوت زیادی با تصویری براق از یک غول فناوری مانند آمازون دارد که ارزش بازار آن بیش از ۲ تریلیون دلار است.
مهندسان اینجا تلاش میکنند تا جایگزینی قابل اعتماد برای پردازندههای پرتقاضای انویدیا ارائه دهند. اگرچه قدرت محاسباتی خام هدف اصلی نیست، تمرکز بیشتر بر ساخت یک سیستم قابلاعتماد است که بتواند مراکز داده آمازون را به ماشینهای بزرگ هوش مصنوعی تبدیل کند.
رامی سینو، مهندس باتجربهای که سالها در طراحی چیپهای نیمههادی فعالیت کرده، هدایت این تلاشها را بر عهده دارد. سینو پس از نظارت بر طراحی اولین چیپهای هوش مصنوعی آمازون، در حال تلاش است تا نسل بعدی چیپهای Trainium2 را تا پایان سال جاری در مراکز داده راهاندازی کند. سینو میگوید: «چیزی که من را شبها بیدار نگه میدارد این است که چگونه میتوانم هر چه سریعتر به آن هدف برسم.»
در دو سال گذشته، انویدیا از یک تولیدکننده چیپ کوچک به تأمینکننده اصلی سختافزار هوش مصنوعی تبدیل شده است که این تحولی ناشی از تقاضای زیاد برای فناوریهای هوش مصنوعی مولد بوده است. پردازندههای انویدیا هرکدام دهها هزار دلار قیمت دارند و به دلیل تقاضای زیاد، به سختی قابلدسترس هستند. آمازون، مایکروسافت و گوگل که بزرگترین مشتریان انویدیا هستند، بهدنبال کاهش وابستگی خود به این شرکت و توسعه چیپهای سفارشی خود هستند. آمازون تاکنون بیشترین تعداد چیپهای هوش مصنوعی را به کار گرفته است.
آمازون از موقعیت منحصر به فردی برای رقابت در این بازار برخوردار است. این شرکت پانزده سال پیش کسبوکار رایانش ابری را بنیانگذاری کرد و به تدریج زیرساختهای سختافزاری موردنیاز آن را ساخته است. در طول سالها، آمازون وابستگی خود را به تأمینکنندگان بزرگ مانند اینتل کاهش داده و بسیاری از سرورها و سوئیچهای شبکه خود را با سختافزار سفارشی جایگزین کرده است. ده سال پیش، جیمز همیلتون، مهندس ارشد آمازون، توانست جف بزوس را متقاعد کند که آمازون باید به طراحی چیپ بپردازد.
با اینکه آمازون هنوز مدل هوش مصنوعی بزرگی مشابه ChatGPT یا Claude تولید نکرده است، زیرساختهایی که ساخته، از جمله سرورها، سوئیچها و چیپها، زمینه را برای تبدیل شدن این شرکت به یکی از تأمینکنندگان اصلی سختافزار هوش مصنوعی فراهم کرده است. هدف اندی جاسی، مدیرعامل آمازون، ایجاد یک بازار برای کسبوکارهاست تا هم مدلهای ساخته شده توسط دیگران و هم چیپهایی برای آموزش مدلهای هوش مصنوعی خود را خریداری کنند.
همیلتون، که سالها در صنعت چیپ مشغول بوده، به خوبی میداند که پیشرفت در پروژههای چیپ آمازون کار سادهای نخواهد بود. طراحی سختافزار هوش مصنوعی چالشبرانگیز است و حتی پیچیدهتر از آن، توسعه نرمافزاری است که بتواند این چیپها را برای طیف وسیعی از مشتریان مفید کند. محصولات انویدیا هم از نظر قدرت محاسباتی و هم از نظر اکوسیستم نرمافزاری که ارائه میدهد، برتری دارند. با این حال، همیلتون معتقد است که تجربه آمازون در طراحی سختافزار سفارشی به این شرکت این امکان را میدهد که با انویدیا در زمینه عملکرد و هزینه رقابت کند.
همیلتون که در سال ۲۰۰۹ به آمازون پیوسته، نقش مهمی در تلاشهای اولیه آمازون برای جایگزینی سختافزارهای آماده با سرورهای سفارشی ایفا کرد. تیم او شروع به طراحی چیپهایی کرد که مکمل مراکز داده AWS باشند و نیاز به اینتل را کاهش دهند. آمازون در نهایت شرکت Annapurna Labs را که یک استارتاپ تخصصی در ساخت چیپهای سفارشی برای مراکز داده بود، خریداری کرد و این شرکت مبنای پروژههای چیپ آمازون شد.
اولین چیپ طراحیشده توسط آمازون، Inferentia، در سال ۲۰۱۹ معرفی شد و هدف آن پردازش وظایف استنتاج، مانند شناسایی الگوها و پیشبینیها بود. چیپ دوم، Trainium1، برای آموزش مدلهای یادگیری ماشین طراحی شد. با وجود تقاضای کند اولیه، این چیپها در میان شرکتهایی که به دنبال ساخت مدلهای هوش مصنوعی مولد به زبانهایی غیر از انگلیسی بودند، مانند شرکتهای فناوری ژاپنی، به کار گرفته شد.
حالا، چیپ نسل سوم آمازون، Trainium2، برای رقابت با سلطه انویدیا در نظر گرفته شده است، با بهبودهایی در عملکرد و ظرفیت حافظه. آمازون شروع به ارسال Trainium2 به مراکز داده در اوهایو و مکانهای دیگر کرده است. این شرکت برنامه دارد هر ۱۸ ماه یکبار چیپهای جدیدی به بازار عرضه کند و بر کاهش زمان و هزینههای مرتبط با تأمین قطعات از تأمینکنندگان خارجی تمرکز دارد.
با این حال، رقابت بسیار شدید است. انویدیا به نوآوریهای خود ادامه میدهد و هر سال چیپهای جدیدی به بازار عرضه میکند، در حالی که گوگل و مایکروسافت نیز به سرعت در حال گسترش پروژههای چیپ خود هستند. چیپهای Tensor گوگل که ابتدا برای خدمات جستجو طراحی شده بودند، اکنون در اختیار مشتریان ابری قرار میگیرند و مایکروسافت نیز بهتازگی AI accelerator جدیدی به نام Maia و پردازندههای مرکزی جدید خود را معرفی کرده است.
با وجود این تلاشها، انویدیا همچنان پیشرو است، با اکوسیستم نرمافزاری جامع و مشتریان گسترده. موفقیت Trainium2 آمازون به این بستگی دارد که بتواند طیف وسیعتری از کارکردها را مدیریت کند و مزایای قابلتوجهی از نظر هزینه و عملکرد ارائه دهد. مهندسان آمازون سخت تلاش کردهاند تا طراحی چیپ را بهبود بخشند، از جمله سادهسازی سختافزار و بهینهسازی سیستمهای خنککننده.
آمازون امیدوار است که Trainium2 بتواند بخشی از بار پردازشی داخلی خود را از دوش پردازندههای انویدیا بردارد و آنها را برای مشتریانی که نیاز به چیپهای تخصصی دارند، آزاد کند. اما موفقیت چیپهای آمازون به این بستگی دارد که نرمافزار آن به درستی عمل کند. در حالی که اکوسیستم نرمافزاری انویدیا به مشتریان این امکان را میدهد که پروژههای یادگیری ماشین خود را با حداقل تلاش راهاندازی کنند، نرمافزار آمازون به نام Neuron SDK هنوز در مراحل ابتدایی است، که این کار را برای مشتریان دشوارتر میکند تا بدون صرف وقت زیاد به سختافزار آمازون منتقل شوند.
برای غلبه بر این موانع، آمازون از شرکای مهم خود مانند دیتابریکس و آنتروپیک کمک گرفته تا چیپها را در کاربردهای واقعی آزمایش و بهبود دهند. آنتروپیک که ۴ میلیارد دلار از آمازون سرمایه دریافت کرده، اکنون از Trainium برای برخی از کارکردهای هوش مصنوعی خود استفاده میکند و به گسترش استفاده از آن ادامه میدهد.
برای اینکه آمازون بتواند با انویدیا در بازار چیپهای هوش مصنوعی رقابت کند، باید نرمافزار خود را بهدرستی طراحی کند و اطمینان حاصل کند که مشتریان بتوانند بهراحتی به سختافزار آن منتقل شوند. همانطور که همیلتون میگوید: «اگر شکاف پیچیدگی را پر نکنید، موفق نخواهید شد.»