Music Modelsminimax

معرفی و مستندات مدل هوش مصنوعی music-1.5

مستندات مدل تولید موسیقی music-1.5 از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک متون فارسی در حد قابل قبولی است اما ممکن است در تولید موسیقی با اشعار فارسی نیاز به تنظیمات بیشتری باشد.

مدل music-1.5 یک مدل هوش مصنوعی است که توسط minimax توسعه داده شده و برای تولید قطعات موسیقی کامل با آوازهای طبیعی و تنظیمات دقیق سازها طراحی شده است. این مدل قادر است آهنگ‌هایی تا 4 دقیقه ایجاد کند. با استفاده از این مدل، کاربران می‌توانند با ارائه توضیحات متنی در مورد سبک، حالت و سناریوی مورد نظر، قطعات موسیقی منحصربه‌فردی تولید کنند. همچنین، امکان تعیین متن ترانه (lyrics) با استفاده از تگ‌های ساختاری مانند [Intro]، [Verse]، [Chorus]، [Bridge] و [Outro] وجود دارد تا تنظیمات آهنگ بهینه‌سازی شوند.

این مدل از طریق API قابل دسترسی است و کاربران می‌توانند با ارسال درخواست‌های HTTP، قطعات موسیقی جدیدی تولید کنند. فرایند تولید موسیقی ممکن است بین 60 تا 80 ثانیه یا بیشتر طول بکشد، که بستگی به بار سرویس دارد. پس از ارسال درخواست، یک شناسه (ID) تولید به کاربر ارائه می‌شود که از طریق آن می‌توان وضعیت تولید موسیقی را پیگیری کرد و پس از تکمیل، فایل صوتی را از سرور دریافت نمود.

برای استفاده از این مدل، کاربران باید یک کلید API معتبر داشته باشند. این کلید به عنوان مجوز دسترسی به API مورد استفاده قرار می‌گیرد و باید در هدر Authorization درخواست‌های HTTP قرار داده شود. همچنین، کاربران می‌توانند تنظیمات صوتی مختلفی مانند نرخ نمونه‌برداری (sample rate)، بیت‌ریت (bitrate) و فرمت فایل (format) را برای قطعه موسیقی تولید شده تعیین کنند.

مدل music-1.5 با ارائه امکانات گسترده و انعطاف‌پذیر، به کاربران این امکان را می‌دهد تا به سادگی و با کیفیت بالا، قطعات موسیقی مورد نظر خود را تولید کنند. این مدل مناسب برای آهنگسازان، تولیدکنندگان موسیقی و هر کسی است که به دنبال ایجاد موسیقی با استفاده از هوش مصنوعی است. با استفاده از این مدل، کاربران می‌توانند ایده‌های خلاقانه خود را به سرعت و با دقت به واقعیت تبدیل کنند و قطعات موسیقی منحصربه‌فردی ایجاد کنند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید موسیقی. مقدار ثابت: minimax/music-1.5
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحی درباره موسیقی، شامل سبک، حالت و سناریو. طول: 10-300 کاراکتر.
lyrics
stringRequired
متن ترانه. از () برای جدا کردن خطوط استفاده کنید. می‌توانید از تگ‌های ساختاری مانند [Intro]، [Verse]، [Chorus]، [Bridge]، [Outro] برای بهبود تنظیمات استفاده کنید. طول: 10-3000 کاراکتر.
audio_setting
object
تنظیمات صوتی اختیاری. شامل پارامترهایی مانند sample_rate، bitrate و format.
generation_id
stringRequired
شناسه تولید موسیقی که برای بازیابی فایل صوتی تولید شده استفاده می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import time
import requests
# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = '<YOUR_AI-KARAPI_KEY>'
# Creating and sending an audio generation task to the server (returns a generation ID)
def generate_audio():
    url = "https://api.ai-kar.com/v2/generate/audio"
    payload = {
        "model": "minimax/music-1.5",
        "prompt": "A calm and soothing instrumental music with gentle piano and soft strings.",
        "lyrics": "[Verse]\nStreetlights flicker, the night breeze sighs\nShadows stretch as I walk alone\nAn old coat wraps my silent sorrow\nWandering, longing, where should I go\n[Chorus]\nPushing the wooden door, the aroma spreads\nIn a familiar corner, a stranger gazes back\nWarm lights flicker, memories awaken\nIn this small cafe, I find my way\n[Verse]\nRaindrops tap on the windowpane\nA melody plays, soft and low\nThe clink of cups, the murmur of dreams\nIn this haven, I find my home\n[Chorus]\nPushing the wooden door, the aroma spreads\nIn a familiar corner, a stranger gazes back\nWarm lights flicker, memories awaken\nIn this small cafe, I find my way"
    }
    headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
    response = requests.post(url, json=payload, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print("Generation:", response_data)
        return response_data
# Requesting the result of the generation task from the server using the generation_id:
def retrieve_audio(gen_id):
    url = "https://api.ai-kar.com/v2/generate/audio"
    params = {
        "generation_id": gen_id,
    }
    headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
    response = requests.get(url, params=params, headers=headers)
    return response.json()
# This is the main function of the program. From here, we sequentially call the audio generation and then repeatedly request the result from the server every 10 seconds:
def main():
    generation_response = generate_audio()
    gen_id = generation_response.get("id")
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = retrieve_audio(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            if status == "generating" or status == "queued" or status == "waiting":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Generation complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None
if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "text",
  "status": "queued"
}