معرفی و مستندات مدل هوش مصنوعی wan-2.2-plus-text-to-video
مستندات مدل تولید ویدیو از متن wan-2.2-plus-text-to-video از alibaba-cloud، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک مفاهیم پیچیده و ظریف فارسی ممکن است با چالش مواجه شود، اما در کل برای تولید ویدیو از توضیحات ساده فارسی قابل استفاده است.
معرفی مدل wan-2.2-plus-text-to-video
مدل wan-2.2-plus-text-to-video یک مدل پیشرفته تولید ویدیو از متن (Text-to-Video) است که توسط Alibaba Cloud توسعه داده شده است. این مدل قادر است ویدیوهای صامت با کیفیت 480p و 1080p با نرخ فریم تقریبی 30 فریم بر ثانیه تولید کند. این مدل به کاربران اجازه میدهد تا با ارائه یک توضیح متنی، ویدیویی با محتوای مورد نظر خود ایجاد کنند.
کاربردهای مدل
این مدل در زمینههای مختلفی کاربرد دارد، از جمله:
- تولید محتوای آموزشی: ایجاد ویدیوهای آموزشی کوتاه بر اساس متنهای آموزشی.
- تبلیغات: ساخت ویدیوهای تبلیغاتی جذاب و خلاقانه با استفاده از توضیحات متنی.
- سرگرمی: تولید ویدیوهای سرگرمکننده و خلاقانه برای شبکههای اجتماعی و پلتفرمهای اشتراک ویدیو.
- پیشنمایش فیلم و سریال: ایجاد پیشنمایشهای اولیه از فیلمها و سریالها بر اساس فیلمنامه.
- تولید محتوای خبری: ساخت ویدیوهای خبری کوتاه بر اساس گزارشهای متنی.
نحوه استفاده
برای استفاده از این مدل، ابتدا باید یک کلید API از سرویس AI-KAR دریافت کنید. سپس، با استفاده از API ارائه شده، میتوانید درخواست تولید ویدیو را ارسال کنید. این فرایند شامل دو مرحله است:
- ارسال درخواست تولید ویدیو به سرور و دریافت یک شناسه تولید (generation ID).
- درخواست ویدیو تولید شده از سرور با استفاده از شناسه تولید دریافت شده.
مزایا
- کیفیت بالا: تولید ویدیوهای با کیفیت 480p و 1080p.
- سرعت بالا: تولید ویدیو با نرخ فریم تقریبی 30 فریم بر ثانیه.
- سهولت استفاده: استفاده آسان از طریق API.
- انعطافپذیری: امکان تنظیم پارامترهای مختلف مانند رزولوشن، نسبت تصویر و غیره.
محدودیتها
- صامت بودن ویدیوها: ویدیوهای تولید شده فاقد صدا هستند.
- نیاز به کلید API: برای استفاده از مدل، نیاز به دریافت کلید API از سرویس AI-KAR دارید.
نکات مهم
- برای دریافت نتایج مختلف با استفاده از پارامترهای مشابه، میتوانید از مقادیر مختلف برای پارامتر seed استفاده کنید.
- برای جلوگیری از نمایش عناصر ناخواسته در ویدیو، میتوانید از پارامتر negative_prompt استفاده کنید.
با استفاده از مدل wan-2.2-plus-text-to-video، میتوانید به راحتی ویدیوهای خلاقانه و جذابی را از متن تولید کنید. این مدل ابزاری قدرتمند برای تولید محتوای ویدیویی در زمینههای مختلف است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار ثابت: alibaba/wan2.2-t2v-plus مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که میخواهید در ویدیو تولید شود. |
resolution | string | رزولوشن ویدیو تولید شده. تعیین میکند که ضلع کوچکتر فریم ویدیو چه رزولوشنی داشته باشد. مقدار پیشفرض: 1080P مقادیر مجاز (کلیک برای کپی): |
aspect_ratio | string | نسبت تصویر ویدیو تولید شده. مقدار پیشفرض: 16:9 مقادیر مجاز (کلیک برای کپی): |
negative_prompt | string | توضیحات عناصری که باید در ویدیو از آنها اجتناب شود. |
watermark | boolean | مشخص میکند که آیا ویدیو حاوی واترمارک باشد یا خیر. مقدار پیشفرض: false مقادیر مجاز (کلیک برای کپی): |
seed | integer | تغییر مقدار seed باعث میشود نتایج متفاوتی برای پارامترهای درخواست یکسان بدست آید. استفاده از مقدار یکسان برای درخواستهای یکسان نتایج مشابهی تولید میکند. اگر مشخص نشود، یک عدد تصادفی انتخاب میشود. |
enable_prompt_expansion | boolean | مشخص میکند که آیا گسترش prompt فعال شود یا خیر. مقدار پیشفرض: true مقادیر مجاز (کلیک برای کپی): |
generation_id | stringRequired | شناسه تولید ویدیو که از درخواست اولیه دریافت شده است. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/generate/video/alibaba/generation"
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
}
data = {
"model": "alibaba/wan2.2-t2v-plus",
"prompt": '''
A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming.
'''
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/generate/video/alibaba/generation"
params = {
"generation_id": gen_id,
}
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 1000
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}