Music Modelsminimax
معرفی و مستندات مدل هوش مصنوعی minimax-music-legacy
مستندات مدل تولید موسیقی minimax-music-legacy از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک متن فارسی در حد ارائه دستورالعملهای ساده و اشعار کوتاه است.
مدل minimax-music-legacy یک مدل هوش مصنوعی پیشرفته است که برای تولید قطعات موسیقی متنوع و با کیفیت بالا طراحی شده است. این مدل با تجزیه و تحلیل الگوهای موسیقی، ریتمها و سبکهای آوازی از یک قطعه مرجع، قادر به بازتولید و ایجاد آثار جدید است. کاربران میتوانند با استفاده از یک متن (prompt)، فرآیند تولید موسیقی را بهبود بخشند و به نتایج دلخواه نزدیکتر شوند. این مدل با بهرهگیری از الگوریتمهای یادگیری عمیق، قادر است تا بافتها، هارمونیها و ملودیهای پیچیده را درک کرده و قطعاتی نوآورانه و جذاب تولید کند. یکی از ویژگیهای برجسته این مدل، توانایی استخراج اطلاعات از قطعه مرجع است. مدل minimax-music-legacy میتواند ژانر، سبک، تمپو، صداهای وکال و سازها، و همچنین حال و هوای کلی قطعه را از فایل مرجع استخراج کند. این اطلاعات سپس برای تولید قطعه جدید با حفظ ویژگیهای مورد نظر کاربر به کار گرفته میشوند. کاربران میتوانند از این قابلیت برای ایجاد موسیقی در سبکها و ژانرهای مختلف استفاده کنند، بدون اینکه نیاز به دانش تخصصی در زمینه آهنگسازی داشته باشند. علاوه بر این، مدل minimax-music-legacy از پارامترهای قابل تنظیم متعددی برخوردار است که به کاربران امکان میدهد تا جزئیات مختلف قطعه موسیقی تولید شده را کنترل کنند. این پارامترها شامل مواردی مانند طول قطعه، شدت ریتم، تنوع هارمونی و غیره میشوند. با تنظیم این پارامترها، کاربران میتوانند قطعاتی را تولید کنند که دقیقاً با نیازها و سلیقههای آنها همخوانی داشته باشد. برای استفاده از مدل minimax-music-legacy، کاربران باید ابتدا یک حساب کاربری در پلتفرم ای آی کار (AI-KAR) ایجاد کنند و یک کلید API دریافت کنند. سپس، با استفاده از این کلید API، میتوانند درخواستهای تولید موسیقی را به سرور ارسال کنند. فرآیند تولید موسیقی شامل دو مرحله است: ابتدا، یک درخواست برای ایجاد و ارسال یک وظیفه تولید موسیقی به سرور ارسال میشود. این درخواست شامل اطلاعاتی مانند قطعه مرجع، متن (prompt) و پارامترهای تنظیم است. سرور پس از دریافت درخواست، یک شناسه تولید (generation ID) را برمیگرداند. در مرحله دوم، با استفاده از شناسه تولید، میتوان وضعیت وظیفه تولید موسیقی را بررسی کرد و پس از اتمام، قطعه موسیقی تولید شده را از سرور دریافت کرد. این فرآیند به کاربران امکان میدهد تا به راحتی و با کمترین دانش فنی، قطعات موسیقی با کیفیت بالا تولید کنند. مدل minimax-music-legacy به عنوان یک ابزار قدرتمند برای آهنگسازان، تولیدکنندگان موسیقی و علاقهمندان به این حوزه، امکانات بینظیری را فراهم میکند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. مقدار ثابت: minimax-music مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن آهنگ با فرمت اختیاری. میتوانید از یک خط جدید برای جدا کردن هر خط شعر استفاده کنید. میتوانید از دو خط جدید برای اضافه کردن مکث بین خطوط استفاده کنید. میتوانید از علامتهای هش دوتایی (##) در ابتدا و انتهای شعر برای اضافه کردن همراهی استفاده کنید. حداکثر 600 کاراکتر. |
reference_audio_url | stringRequired | آدرس URL آهنگ مرجع. باید شامل موسیقی و آواز باشد. باید یک فایل .wav یا .mp3 طولانیتر از 15 ثانیه باشد. |
generation_id | stringRequired | شناسه تولید (generation ID) برای بازیابی فایل صوتی تولید شده. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import time
import requests
# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = '<YOUR_AI-KARAPI_KEY>'
# Creating and sending an audio generation task to the server (returns a generation ID)
def generate_audio():
url = "https://api.ai-kar.com/v1/generate/audio"
payload = {
"model": "minimax-music",
"reference_audio_url": 'https://tand-dev.github.io/audio-hosting/spinning-head-271171.mp3',
"prompt": '''
##Side by side, through thick and thin, \n\nWith a laugh, we always win. \n\n Storms may come, but we stay true, \n\nFriends forever—me and you!##
'''
}
headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
print("Generation:", response_data)
return response_data
# Requesting the result of the generation task from the server using the generation_id:
def retrieve_audio(gen_id):
url = "https://api.ai-kar.com/v1/generate/audio"
params = {
"generation_id": gen_id,
}
headers = {"Authorization": f"Bearer {AI-KARapi_key}", "Content-Type": "application/json"}
response = requests.get(url, params=params, headers=headers)
return response.json()
# This is the main function of the program. From here, we sequentially call the audio generation and then repeatedly request the result from the server every 10 seconds:
def main():
generation_response = generate_audio()
gen_id = generation_response.get("id")
if gen_id:
start_time = time.time()
timeout = 600
while time.time() - start_time < timeout:
response_data = retrieve_audio(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
if status == "generating" or status == "queued" or status == "waiting":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Generation complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"audio_file": {
"url": "https://example.com"
},
"id": "text",
"status": "queued",
"error": null
}