Music Modelsminimax
معرفی و مستندات مدل هوش مصنوعی music-01
مستندات مدل تولید موسیقی music-01 از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت ضعیف پشتیبانی میکند و بیشتر برای تحلیل الگوهای موسیقی و تولید قطعات بر اساس آنها طراحی شده است.
مدل music-01 یک مدل هوش مصنوعی پیشرفته است که برای تولید قطعات موسیقی متنوع و با کیفیت بالا طراحی شده است. این مدل با تحلیل و بازسازی الگوهای موسیقیایی، ریتمها و سبکهای آوازی از قطعه مرجع، قادر به خلق آثار جدید است. کاربران میتوانند با استفاده از یک متن ورودی (prompt)، فرآیند تولید را بهبود بخشند و به نتایج دلخواه نزدیکتر شوند. این مدل با بهرهگیری از الگوریتمهای یادگیری عمیق، قادر است تا الگوهای پیچیده موسیقی را شناسایی کرده و با ترکیب آنها، قطعاتی نوآورانه و جذاب ایجاد کند. music-01 نه تنها قادر به تولید موسیقیهای جدید است، بلکه میتواند سبکهای مختلف موسیقی را نیز تقلید کند. این ویژگی به کاربران امکان میدهد تا با انتخاب سبک مورد نظر، قطعاتی متناسب با سلیقه خود تولید کنند. همچنین، این مدل قابلیت تنظیم پارامترهای مختلف موسیقی مانند تمپو، گام و سازبندی را نیز فراهم میکند. با استفاده از این پارامترها، کاربران میتوانند قطعاتی کاملاً سفارشی و منحصر به فرد ایجاد کنند. مدل music-01 در زمینههای مختلفی کاربرد دارد. از جمله این کاربردها میتوان به تولید موسیقی پسزمینه برای فیلمها و بازیهای ویدیویی، ساخت آهنگهای تبلیغاتی، تولید موسیقی برای شبکههای اجتماعی و ایجاد قطعات موسیقی هنری اشاره کرد. این مدل با ارائه امکانات گسترده و رابط کاربری آسان، به کاربران امکان میدهد تا به راحتی و بدون نیاز به دانش تخصصی موسیقی، قطعاتی با کیفیت بالا تولید کنند. همچنین، music-01 با پشتیبانی از فرمتهای مختلف صوتی، امکان استفاده از قطعات تولید شده در پلتفرمهای مختلف را فراهم میکند. این مدل به طور مداوم در حال بهبود و توسعه است و با ارائه ویژگیهای جدید، سعی در رفع نیازهای کاربران و ارائه تجربهای بهتر دارد. تیم توسعهدهنده music-01 همواره در تلاش است تا با بهرهگیری از آخرین دستاوردهای هوش مصنوعی، این مدل را به ابزاری قدرتمند و کارآمد برای تولید موسیقی تبدیل کند. این مدل با قابلیتهای منحصر به فرد خود، به کاربران امکان میدهد تا خلاقیت خود را در زمینه موسیقی به شکوفایی برسانند و قطعاتی بینظیر خلق کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
file | string · binaryRequired | مسیر محلی فایل صوتی. فرمتهای WAV و MP3 پشتیبانی میشوند. مدت زمان فایل صوتی باید بین 10 ثانیه تا 10 دقیقه باشد. |
purpose | string · enumRequired | تعیین هدف از آپلود فایل. اگر هدف 'song' باشد، باید یک فایل موسیقی شامل وکال و ساز آپلود کنید. اگر هدف 'voice' باشد، باید فقط وکال (به صورت آواز) آپلود کنید. اگر هدف 'instrumental' باشد، باید فقط ساز آپلود کنید. مقادیر مجاز (کلیک برای کپی): |
refer_voice | string | شناسه صدای مرجع که از آپلود فایل صوتی بدست آمده است. |
refer_instrumental | string | شناسه ساز مرجع که از آپلود فایل صوتی بدست آمده است. |
lyrics | string | متن شعر یا لیریک مورد نظر برای تولید موسیقی. |
model | string | نام مدل هوش مصنوعی مورد استفاده. مقدار پیشفرض music-01 است. مقادیر مجاز (کلیک برای کپی): |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
# Insert your ای آی کار (AI-KAR) key here:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
# Input data
audio_url = "https://tand-dev.github.io/audio-hosting/spinning-head-271171.mp3"
file_name = "spinning-head-271171.mp3"
purpose = "song" # Possible values: 'song', 'voice', 'instrumental'
def upload_reference_file():
"""Download file from URL and upload it to AI-KAR API"""
url = "https://api.ai-kar.com/v2/generate/audio/minimax/upload"
try:
# Step 1: Download the file
response = requests.get(audio_url)
response.raise_for_status()
# Step 2: Upload to AI-KAR API
payload = {"purpose": purpose}
files = {"file": (file_name, response.content, "audio/mpeg")}
headers = {"Authorization": f"Bearer {AI-KARapi_key}"}
upload_response = requests.post(url, headers=headers, files=files, data=payload)
upload_response.raise_for_status()
data = upload_response.json()
print("Upload successful:", data)
return data # return JSON with file ids
except requests.exceptions.RequestException as error:
print(f"Error during upload: {error}")
return None
def generate_audio(voice_id=None, instrumental_id=None):
"""Send audio generation request and save result"""
url = "https://api.ai-kar.com/v2/generate/audio/minimax/generate"
lyrics = (
"##Side by side, through thick and thin, \n\n"
"With a laugh, we always win. \n\n"
"Storms may come, but we stay true, \n\n"
"Friends forever—me and you!##"
)
payload = {
"refer_voice": voice_id,
"refer_instrumental": instrumental_id,
"lyrics": lyrics,
"model": "music-01",
}
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {AI-KARapi_key}",
}
response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()
audio_hex = response.json()["data"]["audio"]
decoded_hex = bytes.fromhex(audio_hex)
out_name = "generated_audio.mp3"
with open(out_name, "wb") as f:
f.write(decoded_hex)
print(f"Generated audio saved as {out_name}")
def main():
uploaded = upload_reference_file()
if not uploaded:
return
# Extract IDs depending on purpose
voice_id = uploaded.get("voice_id")
instrumental_id = uploaded.get("instrumental_id")
generate_audio(voice_id, instrumental_id)
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"voice_id": "vocal-2025011003141025-d5ZEMxmp",
"instrumental_id": "instrumental-2025011003141125-Akz9eWnD",
"base_resp": {
"status_code": 1,
"status_msg": "text"
}
}