Music Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی lyria-2
پیشرفتهترین مدل تولید موسیقی گوگل (DeepMind) با قابلیت ساخت موسیقی باکیفیت و آواز (Vocals)، ارائه شده در پلتفرم ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
مانند اکثر مدلهای تولید موسیقی، Lyria-2 بر روی دیتاستهای غربی آموزش دیده است. اگرچه میتوانید پرامپت فارسی ارسال کنید، اما برای دریافت دقیقترین سبک موسیقی و جلوگیری از سوءتفاهم مدل در مورد ژانرها، توصیه میشود توصیف آهنگ (مثلاً 'غمگین، پیانو، آرام') را به انگلیسی وارد کنید.
مدل Lyria-2 شاهکار مهندسی تیم Google DeepMind در زمینه تولید موسیقی است. این مدل برای ایجاد موسیقی با کیفیت بالا، پیوستگی طولانی و کنترل دقیق بر خروجی طراحی شده است. برخلاف بسیاری از مدلهای دیگر که تنها ملودیهای ساده تولید میکنند، Lyria-2 توانایی درک پیچیدگیهای ساختار موسیقی، هارمونی و حتی تولید آواز (Vocals) را دارد.
ویژگیهای کلیدی:
یکی از مهمترین ویژگیهای این مدل در اکوسیستم گوگل، ادغام آن با فناوری SynthID است که واترمارکهای نامرئی در صدا قرار میدهد (هرچند در استفاده از API ممکن است این ویژگی متفاوت باشد). این مدل در پروژههایی مانند YouTube Shorts Dream Track استفاده شده و قدرت خود را در تبدیل متن به موسیقیهای پاپ، الکترونیک و سینمایی ثابت کرده است.
چرا در ای آی کار (AI-KAR)؟
ما دسترسی به این مدل قدرتمند را برای توسعهدهندگان ایرانی تسهیل کردهایم. با استفاده از lyria-2، شما میتوانید برای بازیها، ویدیوها و اپلیکیشنهای خود موسیقی متن اختصاصی بسازید. این مدل در حفظ ریتم و ساختار آهنگ در طول زمان بسیار توانمند است و خروجیهایی تولید میکند که کمتر حس «مصنوعی بودن» را به شنونده القا میکند.
ویژگیهای کلیدی:
یکی از مهمترین ویژگیهای این مدل در اکوسیستم گوگل، ادغام آن با فناوری SynthID است که واترمارکهای نامرئی در صدا قرار میدهد (هرچند در استفاده از API ممکن است این ویژگی متفاوت باشد). این مدل در پروژههایی مانند YouTube Shorts Dream Track استفاده شده و قدرت خود را در تبدیل متن به موسیقیهای پاپ، الکترونیک و سینمایی ثابت کرده است.
چرا در ای آی کار (AI-KAR)؟
ما دسترسی به این مدل قدرتمند را برای توسعهدهندگان ایرانی تسهیل کردهایم. با استفاده از lyria-2، شما میتوانید برای بازیها، ویدیوها و اپلیکیشنهای خود موسیقی متن اختصاصی بسازید. این مدل در حفظ ریتم و ساختار آهنگ در طول زمان بسیار توانمند است و خروجیهایی تولید میکند که کمتر حس «مصنوعی بودن» را به شنونده القا میکند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل (lyria-2). مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توصیف متنی موسیقی مورد نظر (مثلاً: 'A lo-fi hip hop beat for studying'). |
negative_prompt | string | چیزهایی که نمیخواهید در موسیقی باشد (مثلاً: 'vocals, drums, noise'). |
duration | number | مدت زمان خروجی به ثانیه. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
url = "https://api.ai-kar.com/sound/v1/generation"
payload = json.dumps({
"model": "lyria-2",
"prompt": "Cinematic sci-fi soundtrack, mysterious atmosphere",
"duration": 15
})
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer YOUR_API_KEY"
}
response = requests.request("POST", url, headers=headers, data=payload)
# ذخیره فایل خروجی
with open("output_music.mp3", "wb") as f:
f.write(response.content)نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"status": "success",
"content_type": "audio/mpeg",
"data": "<Binary Audio Data>"
}