گوگل روز دوشنبه از Veo 2 رونمایی کرد، نسخه جدید ابزار ویدئوسازی مبتنی بر هوش مصنوعی خود که میتواند ویدئوهایی واقعیتر با سبکهای بصری متنوع و با رزولوشن تا ۴k ایجاد کند. این بهروزرسانی درست پس از آن صورت گرفت که OpenAI دسترسی به ابزار خود یعنی Sora را که به دلیل تقاضای بالا در هنگام عرضه متوقف شده بود، دوباره فعال کرد.
گوگل Veo 2 را بهعنوان ابزاری معرفی کرد که با درک بهتر فیزیک دنیای واقعی و ثبت جزئیات حرکات و حالات انسانی، به ایجاد خروجیهای واقعیتر کمک میکند. این ابزار همچنین خطاهای رایج هوش مصنوعی مانند «جزئیات خیالی» مثل انگشتان اضافی یا اشیای غیرمنتظره را کاهش میدهد.
گوگل اعلام کرد: «Veo 2 درک بهتری از فیزیک واقعی و ظرافتهای حرکات و حالتهای انسانی دارد که جزئیات و واقعگرایی کلی آن را بهبود میبخشد.» نمونههای اولیه منتشر شده در شبکههای اجتماعی نشان میدهند که Veo 2 چگونه توانایی تفسیر درخواستهای سینمایی، مانند «فیلم سینمایی، فیلم ۳۵ میلیمتری» را دارد تا کلیپهای بصری جذابی تولید کند.
ابزار Veo که اولینبار در کنفرانس Google I/O در ماه می معرفی شد، اکنون در پلتفرم VideoFX گوگل لبز در دسترس است. Veo 2 در حال حاضر به صورت محدود و از طریق لیست انتظار در دسترس است و به کاربران امکان میدهد ویدئوهای هشتثانیهای با رزولوشن 720p ایجاد کنند.
رقابت داغ Veo و Sora
رقابت بین Veo و Sora با گسترش دسترسی به هر دو ابزار بهزودی شدت خواهد گرفت. ابزار Sora، که در ۹ دسامبر توسط OpenAI دوباره عرضه شد، در همان روز اول به دلیل تقاضای بالا ظرفیتش تکمیل شد و OpenAI مجبور به توقف موقت ثبتنامها شد. دسترسی دوباره در ۱۳ دسامبر فعال شد، اما OpenAI هنوز تعداد کاربران ثبتنامی را اعلام نکرده است.
Sora به کاربران این امکان را میدهد که ویدئوهای کوتاه و با کیفیت بالا از طریق دستورات متنی ایجاد کنند، با گزینهای برای ترکیب و بازآفرینی داراییهای بصری خود کاربر. این ابزار که در فوریه برای اولینبار معرفی شد، ابتدا تنها برای گروه محدودی از هنرمندان و طراحان در دسترس بود. اکنون این ابزار در دو سطح اشتراک ارائه میشود:
۱. ChatGPT Plus (ماهانه ۲۰ دلار): تا ۵۰ ویدئو در ماه با رزولوشن 480p، یا تعداد کمتری در رزولوشن 720p.
۲. ChatGPT Pro (ماهانه ۲۰۰ دلار): ویدئوهایی با رزولوشن بالاتر، مدتزمان طولانیتر، و استفاده تا ۱۰ برابر بیشتر در هر ماه.
در حال حاضر، به دلیل محدودیتهای قانونی نسخه جدید این ابزار به نام Sora Turbo در بریتانیا، سوئیس و منطقه اقتصادی اروپا در دسترس نیست.
نمایش ویژگیها و چالشهای Sora
Sora Turbo قادر است ویدئوهایی تا رزولوشن 1080p و طول حداکثر ۲۰ ثانیه ایجاد کند، با گزینههای نسبت تصویر عریض، عمودی یا مربعی. OpenAI طیف وسیعی از خروجیها را به نمایش گذاشته است، از صحنههای فتورئالیستی — مانند یک پسر در لباس الف یا پرندگان رنگارنگ در حال پرواز — تا خروجیهای سوررئال، مانند سگی با عینک و لباس خانه که کتاب میخواند.
با این حال، محدودیتهای فناوری نیز مشهود است. یک کلیپ محبوب در شبکههای اجتماعی، ژیمناستی را نشان میدهد که حرکات او با تغییر شکلهای عجیب همراه است، از جمله اندامهای اضافی و سری که برای لحظاتی از بدن جدا میشود. این ویدئو چالشهای فعلی هوش مصنوعی در نمایش حرکات پیچیده و آناتومی دقیق را برجسته میکند.
چشمانداز آینده: قیمتگذاری و هنجارها
OpenAI در حال بررسی گزینههای قیمتگذاری متفاوت برای Sora است و قصد دارد آنها را اوایل سال آینده معرفی کند. در بیانیهای درباره عرضه Sora، OpenAI تأکید کرد که تعامل جامعه در شکلدهی به استفاده مسئولانه از ویدئوی تولیدشده با هوش مصنوعی بسیار مهم است: «ما فناوری تولید ویدئوی خود را اکنون معرفی کردهایم تا به جامعه فرصت دهیم امکانات آن را بررسی کرده و هنجارها و تدابیری برای اطمینان از استفاده مسئولانه از آن، همگام با پیشرفت این حوزه، تدوین کند.»