Music Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی lyria-2

پیشرفته‌ترین مدل تولید موسیقی گوگل (DeepMind) با قابلیت ساخت موسیقی باکیفیت و آواز (Vocals)، ارائه شده در پلتفرم ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

مانند اکثر مدل‌های تولید موسیقی، Lyria-2 بر روی دیتاست‌های غربی آموزش دیده است. اگرچه می‌توانید پرامپت فارسی ارسال کنید، اما برای دریافت دقیق‌ترین سبک موسیقی و جلوگیری از سوءتفاهم مدل در مورد ژانرها، توصیه می‌شود توصیف آهنگ (مثلاً 'غمگین، پیانو، آرام') را به انگلیسی وارد کنید.

مدل Lyria-2 شاهکار مهندسی تیم Google DeepMind در زمینه تولید موسیقی است. این مدل برای ایجاد موسیقی با کیفیت بالا، پیوستگی طولانی و کنترل دقیق بر خروجی طراحی شده است. برخلاف بسیاری از مدل‌های دیگر که تنها ملودی‌های ساده تولید می‌کنند، Lyria-2 توانایی درک پیچیدگی‌های ساختار موسیقی، هارمونی و حتی تولید آواز (Vocals) را دارد.

ویژگی‌های کلیدی:
یکی از مهم‌ترین ویژگی‌های این مدل در اکوسیستم گوگل، ادغام آن با فناوری SynthID است که واترمارک‌های نامرئی در صدا قرار می‌دهد (هرچند در استفاده از API ممکن است این ویژگی متفاوت باشد). این مدل در پروژه‌هایی مانند YouTube Shorts Dream Track استفاده شده و قدرت خود را در تبدیل متن به موسیقی‌های پاپ، الکترونیک و سینمایی ثابت کرده است.

چرا در ای آی کار (AI-KAR)؟
ما دسترسی به این مدل قدرتمند را برای توسعه‌دهندگان ایرانی تسهیل کرده‌ایم. با استفاده از lyria-2، شما می‌توانید برای بازی‌ها، ویدیوها و اپلیکیشن‌های خود موسیقی متن اختصاصی بسازید. این مدل در حفظ ریتم و ساختار آهنگ در طول زمان بسیار توانمند است و خروجی‌هایی تولید می‌کند که کمتر حس «مصنوعی بودن» را به شنونده القا می‌کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل (lyria-2).
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توصیف متنی موسیقی مورد نظر (مثلاً: 'A lo-fi hip hop beat for studying').
negative_prompt
string
چیزهایی که نمی‌خواهید در موسیقی باشد (مثلاً: 'vocals, drums, noise').
duration
number
مدت زمان خروجی به ثانیه.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/sound/v1/generation"

payload = json.dumps({
  "model": "lyria-2",
  "prompt": "Cinematic sci-fi soundtrack, mysterious atmosphere",
  "duration": 15
})
headers = {
  "Content-Type": "application/json",
  "Authorization": "Bearer YOUR_API_KEY"
}

response = requests.request("POST", url, headers=headers, data=payload)

# ذخیره فایل خروجی
with open("output_music.mp3", "wb") as f:
    f.write(response.content)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "status": "success",
  "content_type": "audio/mpeg",
  "data": "<Binary Audio Data>"
}