Web Analytics Made Easy - Statcounter

گوگل ابزار هوش مصنوعی Veo 2 را برای رقابت با Sora رونمایی کرد

گوگل با معرفی ابزار جدید ویدئوی هوش مصنوعی خود، Veo 2، رقابت با Sora محصول OpenAI را شدت می‌بخشد.
هوش مصنوعی ویدیو VEO 2 - وی ای او ۲

گوگل روز دوشنبه از Veo 2 رونمایی کرد، نسخه جدید ابزار ویدئو‌سازی مبتنی بر هوش مصنوعی خود که می‌تواند ویدئوهایی واقعی‌تر با سبک‌های بصری متنوع و با رزولوشن تا ۴k ایجاد کند. این به‌روزرسانی درست پس از آن صورت گرفت که OpenAI دسترسی به ابزار خود یعنی Sora را که به دلیل تقاضای بالا در هنگام عرضه متوقف شده بود، دوباره فعال کرد.

گوگل Veo 2 را به‌عنوان ابزاری معرفی کرد که با درک بهتر فیزیک دنیای واقعی و ثبت جزئیات حرکات و حالات انسانی، به ایجاد خروجی‌های واقعی‌تر کمک می‌کند. این ابزار همچنین خطاهای رایج هوش مصنوعی مانند «جزئیات خیالی» مثل انگشتان اضافی یا اشیای غیرمنتظره را کاهش می‌دهد.

گوگل اعلام کرد: «Veo 2 درک بهتری از فیزیک واقعی و ظرافت‌های حرکات و حالت‌های انسانی دارد که جزئیات و واقع‌گرایی کلی آن را بهبود می‌بخشد.» نمونه‌های اولیه منتشر شده در شبکه‌های اجتماعی نشان می‌دهند که Veo 2 چگونه توانایی تفسیر درخواست‌های سینمایی، مانند «فیلم سینمایی، فیلم ۳۵ میلی‌متری» را دارد تا کلیپ‌های بصری جذابی تولید کند.

ابزار Veo که اولین‌بار در کنفرانس Google I/O در ماه می معرفی شد، اکنون در پلتفرم VideoFX گوگل لبز در دسترس است. Veo 2 در حال حاضر به صورت محدود و از طریق لیست انتظار در دسترس است و به کاربران امکان می‌دهد ویدئوهای هشت‌ثانیه‌ای با رزولوشن 720p ایجاد کنند.

رقابت داغ Veo و Sora

رقابت بین Veo و Sora با گسترش دسترسی به هر دو ابزار به‌زودی شدت خواهد گرفت. ابزار Sora، که در ۹ دسامبر توسط OpenAI دوباره عرضه شد، در همان روز اول به دلیل تقاضای بالا ظرفیتش تکمیل شد و OpenAI مجبور به توقف موقت ثبت‌نام‌ها شد. دسترسی دوباره در ۱۳ دسامبر فعال شد، اما OpenAI هنوز تعداد کاربران ثبت‌نامی را اعلام نکرده است.

Sora به کاربران این امکان را می‌دهد که ویدئوهای کوتاه و با کیفیت بالا از طریق دستورات متنی ایجاد کنند، با گزینه‌ای برای ترکیب و بازآفرینی دارایی‌های بصری خود کاربر. این ابزار که در فوریه برای اولین‌بار معرفی شد، ابتدا تنها برای گروه محدودی از هنرمندان و طراحان در دسترس بود. اکنون این ابزار در دو سطح اشتراک ارائه می‌شود:

۱. ChatGPT Plus (ماهانه ۲۰ دلار): تا ۵۰ ویدئو در ماه با رزولوشن 480p، یا تعداد کمتری در رزولوشن 720p.
۲. ChatGPT Pro (ماهانه ۲۰۰ دلار): ویدئوهایی با رزولوشن بالاتر، مدت‌زمان طولانی‌تر، و استفاده تا ۱۰ برابر بیشتر در هر ماه.

در حال حاضر، به دلیل محدودیت‌های قانونی نسخه جدید این ابزار به نام Sora Turbo در بریتانیا، سوئیس و منطقه اقتصادی اروپا در دسترس نیست.

نمایش ویژگی‌ها و چالش‌های Sora

Sora Turbo قادر است ویدئوهایی تا رزولوشن 1080p و طول حداکثر ۲۰ ثانیه ایجاد کند، با گزینه‌های نسبت تصویر عریض، عمودی یا مربعی. OpenAI طیف وسیعی از خروجی‌ها را به نمایش گذاشته است، از صحنه‌های فتورئالیستی — مانند یک پسر در لباس الف یا پرندگان رنگارنگ در حال پرواز — تا خروجی‌های سوررئال، مانند سگی با عینک و لباس خانه که کتاب می‌خواند.

با این حال، محدودیت‌های فناوری نیز مشهود است. یک کلیپ محبوب در شبکه‌های اجتماعی، ژیمناستی را نشان می‌دهد که حرکات او با تغییر شکل‌های عجیب همراه است، از جمله اندام‌های اضافی و سری که برای لحظاتی از بدن جدا می‌شود. این ویدئو چالش‌های فعلی هوش مصنوعی در نمایش حرکات پیچیده و آناتومی دقیق را برجسته می‌کند.

چشم‌انداز آینده: قیمت‌گذاری و هنجارها

OpenAI در حال بررسی گزینه‌های قیمت‌گذاری متفاوت برای Sora است و قصد دارد آنها را اوایل سال آینده معرفی کند. در بیانیه‌ای درباره عرضه Sora، OpenAI تأکید کرد که تعامل جامعه در شکل‌دهی به استفاده مسئولانه از ویدئوی تولیدشده با هوش مصنوعی بسیار مهم است: «ما فناوری تولید ویدئوی خود را اکنون معرفی کرده‌ایم تا به جامعه فرصت دهیم امکانات آن را بررسی کرده و هنجارها و تدابیری برای اطمینان از استفاده مسئولانه از آن، همگام با پیشرفت این حوزه، تدوین کند.»