پلتفرمهای هوش مصنوعی جمینای (Gemini) از گوگل و چتجیپیتی (ChatGPT) از OpenAI از محبوبترین ابزارهای هوش مصنوعی امروزی هستند که میلیونها کاربر فعال دارند و بهطور مرتب بهروزرسانیهای جدید دریافت میکنند. در یک ماه اخیر هر دو شرکت ویژگیهای جدیدی مانند مدلهای بهبود یافته تولید تصویر، تقویت تواناییهای استدلال هوش مصنوعی و ابزارهای تحقیقاتی پیشرفته برای جستجوی آسانتر اطلاعات را معرفی کردند.
هر دو پلتفرم دستیار صوتی دارند (Advanced Voice از OpenAI و Gemini Live از گوگل) و امکان اتصال به منابع داده خارجی و اجرای پروژهها را فراهم میکنند. در ارزیابیهای انسانی، این دو پلتفرم معمولاً در کاربردهای مختلف از یکدیگر پیشی میگیرند و مقایسههای ما نیز نشان داده که گاهی Gemini و گاهی ChatGPT برنده میشوند.
با توجه به بهروزرسانیهای اخیر از سوی OpenAI و گوگل، این دو پلتفرم را در ۷ چالش بررسی کردیم تا برنده نهایی را مشخص کنیم.
مقایسه هوش مصنوعی جمینای و چتجیپیتی
برای این آزمون، از ChatGPT Plus و Gemini Advanced و از پرامپتهایی به زبان انگلیسی استفاده شده تا از بهترین مدلهای هر دو پلتفرم بهره برده شود.
هزینه اشتراک هر دو تقریباً ۲۰ دلار در ماه است که این مقایسه را عادلانه میکند. موارد بررسیشده شامل تولید و تحلیل تصویر، کدنویسی، نویسندگی خلاق، تحقیق، طراحی اتاق و آموزش هوش مصنوعی بود. در ادامه به مقایسه دو پلتفرم خواهیم پرداخت.
۱. تولید تصویر
چالش:
“یک تصویر دقیق از یک گربه سایبورگ در یک اتاق نشیمن آیندهنگر بسازید. گربه باید روی یک کنسول بازی شناور بازی کند و روی یک صندلی معلق نشسته باشد. اتاق باید نمایشگرهای هولوگرافیک، نورهای نئونی و ترکیبی از عناصر فلزی و ارگانیک داشته باشد. زمان شب باشد و نورهای شهر از یک پنجره بزرگ دیده شود.”
نه ChatGPT و نه Gemini در حال حاضر تصاویر را مستقیماً تولید نمیکنند و از مدلهای DALL-E 3 و Imagen 3 استفاده میکنند. تمرکز ارزیابی روی تفسیر دقیق دستور بود و نه لزوما زیبایی تصویر.
برنده: ChatGPT
خروجی ChatGPT گربه را بهعنوان یک سایبورگ واقعی به تصویر کشید و بهتر دستور را اجرا کرد.
۲. تحلیل تصویر
چالش:
تحلیل یک عکس از یک ستاپ بازی از نظر ارگونومی، مدیریت کابلها، نورپردازی، سازماندهی، و چیدمان تجهیزات، با ارائه توصیههای بهبود و تخمین هزینههای انجام شده.
برنده: ChatGPT
پاسخ آن شامل یک خلاصه دقیق بود که عملیتر به نظر میرسید.
۳. کدنویسی
چالش:
یک بازی آرکید به نام “Color Dash” با استفاده از PyGame ایجاد کنید که شامل مکانیکهای تطبیق رنگ، رابط کاربری مینیمالیستی، انیمیشنها، جلوههای صوتی، و کنترلهای روان باشد.
برنده: Gemini
کد ارائهشده توسط Gemini عملکرد بهتری داشت و به اصلاحات کمتری نیاز داشت.
۴. نویسندگی خلاق
چالش:
یک داستان ۵۰۰ کلمهای درباره یک تلفن هوشمند بنویسید که پس از یک بهروزرسانی نرمافزاری به آگاهی میرسد، با موضوعاتی مانند حریم خصوصی، طنز، و روندهای فناوری، همراه با یک پایان غیرمنتظره.
برنده: ChatGPT
اگرچه هر دو خروجی قوی بودند، داستان ChatGPT بهطور دقیقتر به محدودیت کلمات پایبند بود.
۵. توانایی حل مسئله
چالش:
عیبیابی و رفع مشکلی که در آن PS5 متصل به تلویزیون ۴K OLED هر ۴۵-۶۰ دقیقه یکبار هنگام بازی صفحه سیاه نشان میدهد.
برنده: Gemini
پاسخ Gemini ساختار بهتری داشت و دستورالعملهای گامبهگام واضحی ارائه داد.
۶. طراحی اتاق
چالش:
یک اتاق ۴×۳ متری را به فضایی چندمنظوره برای کار از راه دور، کاردستی و میزبانی از والدین سالخورده تبدیل کنید، با بودجه ۲۰۰۰ دلاری.
برنده: ChatGPT
ChatGPT طرحی عملی ارائه داد که در محدوده بودجه باقی ماند، در حالی که Gemini روی گزینههای گرانقیمت تمرکز کرده بود.
۷. آموزش هوش مصنوعی
چالش:
توضیح فرآیند تولید تصویر توسط هوش مصنوعی به زبان ساده، با پوشش مباحثی مانند یادگیری از تصاویر موجود، نقش دستورات متنی، محدودیتها، ملاحظات اخلاقی، و پیشرفتهای مورد انتظار.
برنده: Gemini
Gemini با ارائه جزئیات دقیق درباره سوگیری دادهها و پیامدهای آن برتری داشت.
امتیازات نهایی
دستهبندی | ChatGPT | Gemini |
---|---|---|
تولید تصویر | 🏆 | |
تحلیل تصویر | 🏆 | |
کدنویسی | 🏆 | |
نویسندگی خلاق | 🏆 | |
حل مسئله | 🏆 | |
طراحی اتاق | 🏆 | |
آموزش هوش مصنوعی | 🏆 | |
مجموع | ۴ | ۳ |
نتیجهگیری
ChatGPT با کسب ۴ امتیاز در مقابل ۳ امتیاز Gemini برنده این چالش شد. با این حال، پیشرفتهای قابل توجه Gemini، بهویژه در کدنویسی و حل مسئله، شایان توجه است.
اگرچه در این آزمایش همه ویژگیهای هوش مصنوعی بررسی نشد (مانند کدنویسی پیچیده چندمرحلهای یا مدیریت پروژههای پیشرفته)، اما موارد مطرح شده بهخوبی تواناییهای رو به رشد هر دو پلتفرم را نشان میدهد.
در نهایت، انتخاب شما بین ChatGPT و Gemini ممکن است به نیازهای خاص شم (خواه کدنویسی، تحقیق یا خلاقیت) بستگی داشته باشد.