Music Modelsminimax
معرفی و مستندات مدل هوش مصنوعی music-1.5
مستندات مدل تولید موسیقی music-1.5 از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک متون فارسی در حد قابل قبولی است اما ممکن است در تولید موسیقی با اشعار فارسی نیاز به تنظیمات بیشتری باشد.
مدل music-1.5 یک مدل هوش مصنوعی است که توسط minimax توسعه داده شده و برای تولید قطعات موسیقی کامل با آوازهای طبیعی و تنظیمات دقیق سازها طراحی شده است. این مدل قادر است آهنگهایی تا 4 دقیقه ایجاد کند. با استفاده از این مدل، کاربران میتوانند با ارائه توضیحات متنی در مورد سبک، حالت و سناریوی مورد نظر، قطعات موسیقی منحصربهفردی تولید کنند. همچنین، امکان تعیین متن ترانه (lyrics) با استفاده از تگهای ساختاری مانند [Intro]، [Verse]، [Chorus]، [Bridge] و [Outro] وجود دارد تا تنظیمات آهنگ بهینهسازی شوند.
این مدل از طریق API قابل دسترسی است و کاربران میتوانند با ارسال درخواستهای HTTP، قطعات موسیقی جدیدی تولید کنند. فرایند تولید موسیقی ممکن است بین 60 تا 80 ثانیه یا بیشتر طول بکشد، که بستگی به بار سرویس دارد. پس از ارسال درخواست، یک شناسه (ID) تولید به کاربر ارائه میشود که از طریق آن میتوان وضعیت تولید موسیقی را پیگیری کرد و پس از تکمیل، فایل صوتی را از سرور دریافت نمود.
برای استفاده از این مدل، کاربران باید یک کلید API معتبر داشته باشند. این کلید به عنوان مجوز دسترسی به API مورد استفاده قرار میگیرد و باید در هدر Authorization درخواستهای HTTP قرار داده شود. همچنین، کاربران میتوانند تنظیمات صوتی مختلفی مانند نرخ نمونهبرداری (sample rate)، بیتریت (bitrate) و فرمت فایل (format) را برای قطعه موسیقی تولید شده تعیین کنند.
مدل music-1.5 با ارائه امکانات گسترده و انعطافپذیر، به کاربران این امکان را میدهد تا به سادگی و با کیفیت بالا، قطعات موسیقی مورد نظر خود را تولید کنند. این مدل مناسب برای آهنگسازان، تولیدکنندگان موسیقی و هر کسی است که به دنبال ایجاد موسیقی با استفاده از هوش مصنوعی است. با استفاده از این مدل، کاربران میتوانند ایدههای خلاقانه خود را به سرعت و با دقت به واقعیت تبدیل کنند و قطعات موسیقی منحصربهفردی ایجاد کنند.
این مدل از طریق API قابل دسترسی است و کاربران میتوانند با ارسال درخواستهای HTTP، قطعات موسیقی جدیدی تولید کنند. فرایند تولید موسیقی ممکن است بین 60 تا 80 ثانیه یا بیشتر طول بکشد، که بستگی به بار سرویس دارد. پس از ارسال درخواست، یک شناسه (ID) تولید به کاربر ارائه میشود که از طریق آن میتوان وضعیت تولید موسیقی را پیگیری کرد و پس از تکمیل، فایل صوتی را از سرور دریافت نمود.
برای استفاده از این مدل، کاربران باید یک کلید API معتبر داشته باشند. این کلید به عنوان مجوز دسترسی به API مورد استفاده قرار میگیرد و باید در هدر Authorization درخواستهای HTTP قرار داده شود. همچنین، کاربران میتوانند تنظیمات صوتی مختلفی مانند نرخ نمونهبرداری (sample rate)، بیتریت (bitrate) و فرمت فایل (format) را برای قطعه موسیقی تولید شده تعیین کنند.
مدل music-1.5 با ارائه امکانات گسترده و انعطافپذیر، به کاربران این امکان را میدهد تا به سادگی و با کیفیت بالا، قطعات موسیقی مورد نظر خود را تولید کنند. این مدل مناسب برای آهنگسازان، تولیدکنندگان موسیقی و هر کسی است که به دنبال ایجاد موسیقی با استفاده از هوش مصنوعی است. با استفاده از این مدل، کاربران میتوانند ایدههای خلاقانه خود را به سرعت و با دقت به واقعیت تبدیل کنند و قطعات موسیقی منحصربهفردی ایجاد کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید موسیقی. مقدار ثابت: minimax/music-1.5 مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحی درباره موسیقی، شامل سبک، حالت و سناریو. طول: 10-300 کاراکتر. |
lyrics | stringRequired | متن ترانه. از () برای جدا کردن خطوط استفاده کنید. میتوانید از تگهای ساختاری مانند [Intro]، [Verse]، [Chorus]، [Bridge]، [Outro] برای بهبود تنظیمات استفاده کنید. طول: 10-3000 کاراکتر. |
audio_setting | object | تنظیمات صوتی اختیاری. شامل پارامترهایی مانند sample_rate، bitrate و format. |
generation_id | stringRequired | شناسه تولید موسیقی که برای بازیابی فایل صوتی تولید شده استفاده میشود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import time
import requests
# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = '<YOUR_AI-KARAPI_KEY>'
# Creating and sending an audio generation task to the server (returns a generation ID)
def generate_audio():
url = "https://api.ai-kar.com/v2/generate/audio"
payload = {
"model": "minimax/music-1.5",
"prompt": "A calm and soothing instrumental music with gentle piano and soft strings.",
"lyrics": "[Verse]\nStreetlights flicker, the night breeze sighs\nShadows stretch as I walk alone\nAn old coat wraps my silent sorrow\nWandering, longing, where should I go\n[Chorus]\nPushing the wooden door, the aroma spreads\nIn a familiar corner, a stranger gazes back\nWarm lights flicker, memories awaken\nIn this small cafe, I find my way\n[Verse]\nRaindrops tap on the windowpane\nA melody plays, soft and low\nThe clink of cups, the murmur of dreams\nIn this haven, I find my home\n[Chorus]\nPushing the wooden door, the aroma spreads\nIn a familiar corner, a stranger gazes back\nWarm lights flicker, memories awaken\nIn this small cafe, I find my way"
}
headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
print("Generation:", response_data)
return response_data
# Requesting the result of the generation task from the server using the generation_id:
def retrieve_audio(gen_id):
url = "https://api.ai-kar.com/v2/generate/audio"
params = {
"generation_id": gen_id,
}
headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
response = requests.get(url, params=params, headers=headers)
return response.json()
# This is the main function of the program. From here, we sequentially call the audio generation and then repeatedly request the result from the server every 10 seconds:
def main():
generation_response = generate_audio()
gen_id = generation_response.get("id")
if gen_id:
start_time = time.time()
timeout = 600
while time.time() - start_time < timeout:
response_data = retrieve_audio(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
if status == "generating" or status == "queued" or status == "waiting":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Generation complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "text",
"status": "queued"
}