Music Modelsminimax

معرفی و مستندات مدل هوش مصنوعی music-01

مستندات مدل تولید موسیقی music-01 از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند و بیشتر برای تحلیل الگوهای موسیقی و تولید قطعات بر اساس آن‌ها طراحی شده است.

مدل music-01 یک مدل هوش مصنوعی پیشرفته است که برای تولید قطعات موسیقی متنوع و با کیفیت بالا طراحی شده است. این مدل با تحلیل و بازسازی الگوهای موسیقیایی، ریتم‌ها و سبک‌های آوازی از قطعه مرجع، قادر به خلق آثار جدید است. کاربران می‌توانند با استفاده از یک متن ورودی (prompt)، فرآیند تولید را بهبود بخشند و به نتایج دلخواه نزدیک‌تر شوند. این مدل با بهره‌گیری از الگوریتم‌های یادگیری عمیق، قادر است تا الگوهای پیچیده موسیقی را شناسایی کرده و با ترکیب آن‌ها، قطعاتی نوآورانه و جذاب ایجاد کند. music-01 نه تنها قادر به تولید موسیقی‌های جدید است، بلکه می‌تواند سبک‌های مختلف موسیقی را نیز تقلید کند. این ویژگی به کاربران امکان می‌دهد تا با انتخاب سبک مورد نظر، قطعاتی متناسب با سلیقه خود تولید کنند. همچنین، این مدل قابلیت تنظیم پارامترهای مختلف موسیقی مانند تمپو، گام و سازبندی را نیز فراهم می‌کند. با استفاده از این پارامترها، کاربران می‌توانند قطعاتی کاملاً سفارشی و منحصر به فرد ایجاد کنند. مدل music-01 در زمینه‌های مختلفی کاربرد دارد. از جمله این کاربردها می‌توان به تولید موسیقی پس‌زمینه برای فیلم‌ها و بازی‌های ویدیویی، ساخت آهنگ‌های تبلیغاتی، تولید موسیقی برای شبکه‌های اجتماعی و ایجاد قطعات موسیقی هنری اشاره کرد. این مدل با ارائه امکانات گسترده و رابط کاربری آسان، به کاربران امکان می‌دهد تا به راحتی و بدون نیاز به دانش تخصصی موسیقی، قطعاتی با کیفیت بالا تولید کنند. همچنین، music-01 با پشتیبانی از فرمت‌های مختلف صوتی، امکان استفاده از قطعات تولید شده در پلتفرم‌های مختلف را فراهم می‌کند. این مدل به طور مداوم در حال بهبود و توسعه است و با ارائه ویژگی‌های جدید، سعی در رفع نیازهای کاربران و ارائه تجربه‌ای بهتر دارد. تیم توسعه‌دهنده music-01 همواره در تلاش است تا با بهره‌گیری از آخرین دستاوردهای هوش مصنوعی، این مدل را به ابزاری قدرتمند و کارآمد برای تولید موسیقی تبدیل کند. این مدل با قابلیت‌های منحصر به فرد خود، به کاربران امکان می‌دهد تا خلاقیت خود را در زمینه موسیقی به شکوفایی برسانند و قطعاتی بی‌نظیر خلق کنند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
file
string · binaryRequired
مسیر محلی فایل صوتی. فرمت‌های WAV و MP3 پشتیبانی می‌شوند. مدت زمان فایل صوتی باید بین 10 ثانیه تا 10 دقیقه باشد.
purpose
string · enumRequired
تعیین هدف از آپلود فایل. اگر هدف 'song' باشد، باید یک فایل موسیقی شامل وکال و ساز آپلود کنید. اگر هدف 'voice' باشد، باید فقط وکال (به صورت آواز) آپلود کنید. اگر هدف 'instrumental' باشد، باید فقط ساز آپلود کنید.
مقادیر مجاز (کلیک برای کپی):
refer_voice
string
شناسه صدای مرجع که از آپلود فایل صوتی بدست آمده است.
refer_instrumental
string
شناسه ساز مرجع که از آپلود فایل صوتی بدست آمده است.
lyrics
string
متن شعر یا لیریک مورد نظر برای تولید موسیقی.
model
string
نام مدل هوش مصنوعی مورد استفاده. مقدار پیش‌فرض music-01 است.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests

# Insert your ای آی کار (AI-KAR) key here:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"

# Input data
audio_url = "https://tand-dev.github.io/audio-hosting/spinning-head-271171.mp3"
file_name = "spinning-head-271171.mp3"
purpose = "song"  # Possible values: 'song', 'voice', 'instrumental'

def upload_reference_file():
    """Download file from URL and upload it to AI-KAR API"""
    url = "https://api.ai-kar.com/v2/generate/audio/minimax/upload"
    try:
        # Step 1: Download the file
        response = requests.get(audio_url)
        response.raise_for_status()

        # Step 2: Upload to AI-KAR API
        payload = {"purpose": purpose}
        files = {"file": (file_name, response.content, "audio/mpeg")}
        headers = {"Authorization": f"Bearer {AI-KARapi_key}"}
        upload_response = requests.post(url, headers=headers, files=files, data=payload)
        upload_response.raise_for_status()
        data = upload_response.json()
        print("Upload successful:", data)
        return data  # return JSON with file ids
    except requests.exceptions.RequestException as error:
        print(f"Error during upload: {error}")
        return None

def generate_audio(voice_id=None, instrumental_id=None):
    """Send audio generation request and save result"""
    url = "https://api.ai-kar.com/v2/generate/audio/minimax/generate"
    lyrics = (
        "##Side by side, through thick and thin, \n\n"
        "With a laugh, we always win. \n\n"
        "Storms may come, but we stay true, \n\n"
        "Friends forever—me and you!##"
    )
    payload = {
        "refer_voice": voice_id,
        "refer_instrumental": instrumental_id,
        "lyrics": lyrics,
        "model": "music-01",
    }
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {AI-KARapi_key}",
    }
    response = requests.post(url, headers=headers, json=payload)
    response.raise_for_status()
    audio_hex = response.json()["data"]["audio"]
    decoded_hex = bytes.fromhex(audio_hex)
    out_name = "generated_audio.mp3"
    with open(out_name, "wb") as f:
        f.write(decoded_hex)
    print(f"Generated audio saved as {out_name}")

def main():
    uploaded = upload_reference_file()
    if not uploaded:
        return

    # Extract IDs depending on purpose
    voice_id = uploaded.get("voice_id")
    instrumental_id = uploaded.get("instrumental_id")
    generate_audio(voice_id, instrumental_id)

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "voice_id": "vocal-2025011003141025-d5ZEMxmp",
  "instrumental_id": "instrumental-2025011003141125-Akz9eWnD",
  "base_resp": {
    "status_code": 1,
    "status_msg": "text"
  }
}