گوگل با مدل تصویرساز جدید خود موسوم به نانو بنانا پرو توانسته به سطحی از واقعگرایی برسد که تشخیص تفاوت میان تصویر واقعی و تصویر تولیدشده با هوش مصنوعی را دشوارتر میکند. این مدل با اتکا به درک گسترده جمینای ۳ و اطلاعات جستوجوی گوگل، فراتر از وعدههای اولیه عمل کرده است.
نسخه پیشین نانو بنانا محبوب بود اما ضعفهایی داشت. اکنون نسخه پرو در یک حوزه بهطور قابل توجهی پیشرفت کرده است؛ توانایی تولید متن دقیق و خوانا در تصاویر. این مدل میتواند اینفوگرافیکهای پیچیده ایجاد کند و کپشنها را بدون خطاهای معمول نمایش دهد. چنین قابلیتی تحولساز است، هرچند نگرانیهایی به همراه دارد، زیرا خروجیها در عین کیفیت بالا، حالتی نگرانکننده و بسیار شبیه به نمونههای انسانی دارند.
در آزمایشهای اولیه، این مدل تصاویر فوقواقعگرایانه از افراد و شخصیتها تولید کرد. همین موضوع نگرانیها درباره سوءاستفاده از فناوری برای ساخت تصاویر جعلی افراد شناختهشده را افزایش میدهد. با تواناییهای جدید، تشخیص واقعی بودن محتوا دشوارتر خواهد شد و احتمال خطا یا فریب بیشتر میشود؛ حتی با وجود سیاستها و محدودیتهایی که برای جلوگیری از سوءاستفاده طراحی شدهاند.
در حوزه متنپردازی بصری نیز نانو بنانا پرو مشکل دیرینه تولید نوشته قابلخواندن روی تابلوها، لباسها و نشانهها را تا حد زیادی حل کرده است. این مدل علاوه بر تولید متن بدون خطا، طرحهای مرتب و کاربردی ارائه میدهد و میتواند بر اساس منابع مشخصشده توسط کاربر نیز محتوا تولید کند.
تواناییهای این مدل آن را به نقطه مهمی در تحول رسانههای تولیدی تبدیل کرده است. خروجیهای آن از نظر شباهت با طراحی و عکاسی انسانی در بالاترین سطح قرار دارند و این موضوع نگرانیها درباره سوءاستفاده احتمالی را تشدید میکند. هرچند برخی درخواستها مانند موضوعات مرتبط با اطلاعات غلط حوزه سلامت مسدود میشوند، اما امکان خطا همچنان وجود دارد و نمونههایی از عبور محتوا از فیلترها مشاهده شده است.
با وجود این مخاطرات، این مدل برای کاربران حرفهای و افرادی که نیاز به تولید سریع تصویر، ویرایش یا طراحی اینفوگرافیک دارند، بسیار کارآمد خواهد بود. در نهایت، نانو بنانا پرو را میتوان ابزاری قدرتمند و در عین حال بالقوه خطرناک دانست؛ نمونهای بارز از دوگانه فرصت و تهدید در نوآوری رسانه تولیدی.







