گوگل در کنفرانس Google I/O 2025 از مدل جدید هوش مصنوعی خود با نام Gemma 3n رونمایی کرد. این مدل بهگونهای طراحی شده که بتواند بهراحتی روی دستگاههایی مانند گوشی هوشمند، لپتاپ و تبلت اجرا شود. نسخه پیشنمایش این مدل از هماکنون در دسترس قرار دارد و قابلیت پردازش متن، صدا، تصویر و ویدئو را بهصورت همزمان دارد.
نکته مهم درباره Gemma 3n این است که میتواند بدون نیاز به اینترنت یا پردازش ابری، بهصورت آفلاین روی دستگاههایی با کمتر از ۲ گیگابایت رم اجرا شود. این ویژگی هم باعث کاهش هزینهها میشود و هم امنیت و حریم خصوصی کاربران را افزایش میدهد، چراکه دادهها از دستگاه خارج نمیشوند. به گفته گاس مارتینز، مدیر محصول Gemma، این مدل با همان معماری Gemini Nano ساخته شده و عملکردی چشمگیر دارد.
گوگل همچنین از مدل دیگری به نام MedGemma رونمایی کرده که از طریق برنامه Health AI Developer Foundations در دسترس قرار میگیرد. این مدل برای تحلیل دادههای پزشکی، شامل متن و تصویر، طراحی شده و پیشرفتهترین مدل باز گوگل در حوزه سلامت بهشمار میرود. توسعهدهندگان میتوانند از این مدل در ساخت اپلیکیشنهای سلامت استفاده کنند.
مدل SignGemma نیز در دست توسعه است؛ مدلی که زبان اشاره را به متن گفتاری تبدیل میکند. این مدل فعلاً برای زبان اشاره آمریکایی و زبان انگلیسی بهینهسازی شده و هدف آن کمک به توسعه ابزارهای ارتباطی برای افراد ناشنوا و کمشنواست. مارتینز اعلام کرد که SignGemma قدرتمندترین مدل درک زبان اشارهای است که تاکنون ساخته شده است.
با وجود برخی انتقادها نسبت به شرایط مجوزدهی خاص Gemma — که به گفته برخی توسعهدهندگان، استفاده تجاری از آن را با ابهاماتی روبهرو کرده — استقبال از این مدلها گسترده بوده و تا امروز دهها میلیون بار دانلود شدهاند.