Music Modelsminimax

معرفی و مستندات مدل هوش مصنوعی minimax-music-legacy

مستندات مدل تولید موسیقی minimax-music-legacy از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک متن فارسی در حد ارائه دستورالعمل‌های ساده و اشعار کوتاه است.

مدل minimax-music-legacy یک مدل هوش مصنوعی پیشرفته است که برای تولید قطعات موسیقی متنوع و با کیفیت بالا طراحی شده است. این مدل با تجزیه و تحلیل الگوهای موسیقی، ریتم‌ها و سبک‌های آوازی از یک قطعه مرجع، قادر به بازتولید و ایجاد آثار جدید است. کاربران می‌توانند با استفاده از یک متن (prompt)، فرآیند تولید موسیقی را بهبود بخشند و به نتایج دلخواه نزدیک‌تر شوند. این مدل با بهره‌گیری از الگوریتم‌های یادگیری عمیق، قادر است تا بافت‌ها، هارمونی‌ها و ملودی‌های پیچیده را درک کرده و قطعاتی نوآورانه و جذاب تولید کند. یکی از ویژگی‌های برجسته این مدل، توانایی استخراج اطلاعات از قطعه مرجع است. مدل minimax-music-legacy می‌تواند ژانر، سبک، تمپو، صداهای وکال و سازها، و همچنین حال و هوای کلی قطعه را از فایل مرجع استخراج کند. این اطلاعات سپس برای تولید قطعه جدید با حفظ ویژگی‌های مورد نظر کاربر به کار گرفته می‌شوند. کاربران می‌توانند از این قابلیت برای ایجاد موسیقی در سبک‌ها و ژانرهای مختلف استفاده کنند، بدون اینکه نیاز به دانش تخصصی در زمینه آهنگسازی داشته باشند. علاوه بر این، مدل minimax-music-legacy از پارامترهای قابل تنظیم متعددی برخوردار است که به کاربران امکان می‌دهد تا جزئیات مختلف قطعه موسیقی تولید شده را کنترل کنند. این پارامترها شامل مواردی مانند طول قطعه، شدت ریتم، تنوع هارمونی و غیره می‌شوند. با تنظیم این پارامترها، کاربران می‌توانند قطعاتی را تولید کنند که دقیقاً با نیازها و سلیقه‌های آن‌ها همخوانی داشته باشد. برای استفاده از مدل minimax-music-legacy، کاربران باید ابتدا یک حساب کاربری در پلتفرم ای آی کار (AI-KAR) ایجاد کنند و یک کلید API دریافت کنند. سپس، با استفاده از این کلید API، می‌توانند درخواست‌های تولید موسیقی را به سرور ارسال کنند. فرآیند تولید موسیقی شامل دو مرحله است: ابتدا، یک درخواست برای ایجاد و ارسال یک وظیفه تولید موسیقی به سرور ارسال می‌شود. این درخواست شامل اطلاعاتی مانند قطعه مرجع، متن (prompt) و پارامترهای تنظیم است. سرور پس از دریافت درخواست، یک شناسه تولید (generation ID) را برمی‌گرداند. در مرحله دوم، با استفاده از شناسه تولید، می‌توان وضعیت وظیفه تولید موسیقی را بررسی کرد و پس از اتمام، قطعه موسیقی تولید شده را از سرور دریافت کرد. این فرآیند به کاربران امکان می‌دهد تا به راحتی و با کمترین دانش فنی، قطعات موسیقی با کیفیت بالا تولید کنند. مدل minimax-music-legacy به عنوان یک ابزار قدرتمند برای آهنگسازان، تولیدکنندگان موسیقی و علاقه‌مندان به این حوزه، امکانات بی‌نظیری را فراهم می‌کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار ثابت: minimax-music
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن آهنگ با فرمت اختیاری. می‌توانید از یک خط جدید برای جدا کردن هر خط شعر استفاده کنید. می‌توانید از دو خط جدید برای اضافه کردن مکث بین خطوط استفاده کنید. می‌توانید از علامت‌های هش دوتایی (##) در ابتدا و انتهای شعر برای اضافه کردن همراهی استفاده کنید. حداکثر 600 کاراکتر.
reference_audio_url
stringRequired
آدرس URL آهنگ مرجع. باید شامل موسیقی و آواز باشد. باید یک فایل .wav یا .mp3 طولانی‌تر از 15 ثانیه باشد.
generation_id
stringRequired
شناسه تولید (generation ID) برای بازیابی فایل صوتی تولید شده.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import time
import requests
# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = '<YOUR_AI-KARAPI_KEY>'
# Creating and sending an audio generation task to the server (returns a generation ID)
def generate_audio():
    url = "https://api.ai-kar.com/v1/generate/audio"
    payload = {
        "model": "minimax-music",
        "reference_audio_url": 'https://tand-dev.github.io/audio-hosting/spinning-head-271171.mp3',
        "prompt": '''
##Side by side, through thick and thin, \n\nWith a laugh, we always win. \n\n Storms may come, but we stay true, \n\nFriends forever—me and you!##
'''
    }
    headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
    response = requests.post(url, json=payload, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print("Generation:", response_data)
        return response_data

# Requesting the result of the generation task from the server using the generation_id:
def retrieve_audio(gen_id):
    url = "https://api.ai-kar.com/v1/generate/audio"
    params = {
        "generation_id": gen_id,
    }
    headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
    response = requests.get(url, params=params, headers=headers)
    return response.json()

# This is the main function of the program. From here, we sequentially call the audio generation and then repeatedly request the result from the server every 10 seconds:
def main():
    generation_response = generate_audio()
    gen_id = generation_response.get("id")
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = retrieve_audio(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            if status == "generating" or status == "queued" or status == "waiting":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Generation complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "audio_file": {
    "url": "https://example.com"
  },
  "id": "text",
  "status": "queued",
  "error": null
}