Web Analytics Made Easy - Statcounter

ابزار جدید هوش مصنوعی گوگل می‌تواند متن را به موسیقی تبدیل کند

محققان گوگل، ابزاری ایجاد کرده‌اند که می‌تواند با هوش مصنوعی، قطعات موسیقی را از ورودی‌های متن تولید کند. همانند ChatGPT که می‌تواند یک فرمان متنی را به مکالمه تبدیل کند و DALL-E که تصاویر را از پیام‌های نوشته شده تولید می‌کند؛ این برنامه هوش مصنوعی نیز می‌تواند ورودی متن را به موسیقی و ملودی‌های نوشته شده را به سازهای دیگر تبدیل کند.

ابزار جدید هوش مصنوعی گوگل، می‌تواند از متن وارد شده توسط کاربر، ملودی‌های حداکثر 5 دقیقه‌ای ایجاد کند. به طوری که هرچقدر دستورالعمل‌ها واضح‌تر باشند، موسیقی بهتر به عنوان خروجی ساخته می‌شود. علاوه بر این، در هنگام ورود دستورالعمل امکان انتخاب ژانر، حال‌وهوا و حتی سازهای خاص نیز وجود دارد.

طبق مطالب منتشر شده در گیت‌هاب، این مدل هوش مصنوعی MusicLM نام دارد و این شرکت مجموعه‌ای از نمونه‌های تولید شده را با استفاده از این مدل را بارگذاری کرده است. این نمونه‌ها MusicCaps نامیده می‌شوند و اساساً مجموعه‌ای از داده‌های متشکل از 5/5 هزار جفت موسیقی-متن، همراه با توضیحات متن کامل که توسط متخصصان ارائه‌شده، هستند.

MusicLM نسبت به سیستم‌های قبلی مشابه هم در کیفیت صدا و هم از نظر رعایت توضیحات متن بهتر عمل می‌کند. علاوه بر این، MusicLM می‌تواند هم به متن و هم به ملودی مشروط شود، به این معنی که می‌تواند ملودی‌های زمزمه‌شده را مطابق با موارد توصیف‌شده در یک عنوان متن تغییر دهد.