Video Modelskling-ai
معرفی و مستندات مدل هوش مصنوعی v1.6-standart-image-to-video
مستندات مدل تبدیل تصویر به ویدیو v1.6-standart، توسعه یافته توسط ای ای کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای بهترین نتیجه، توصیه میشود از توضیحات انگلیسی استفاده کنید.
مدل هوش مصنوعی v1.6-standart-image-to-video یک مدل پیشرفته تولید ویدیو است که توسط Kuaishou Technology توسعه یافته است. این مدل برای ایجاد ویدیوهای با کیفیت بالا از تصاویر و توضیحات متنی طراحی شده است. این نسخه بهبودهای چشمگیری در تطابق با دستورات متنی، کیفیت بصری و ارائه کنشهای پویا ارائه میدهد و به کاربران امکان میدهد نتایج سازگارتر و از نظر بصری جذابتری را در مقایسه با نسخه قبلی، Kling 1.5، تولید کنند. این مدل با دریافت یک تصویر و یک توضیح متنی، قادر است ویدیویی کوتاه و مرتبط با محتوای ورودی تولید کند. این فرایند شامل تحلیل تصویر و متن، ترکیب آنها و تولید فریمهای ویدیویی است که با هم یک سکانس ویدیویی معنادار را تشکیل میدهند. این مدل میتواند برای تولید انواع مختلف ویدیوها مورد استفاده قرار گیرد، از جمله ویدیوهای تبلیغاتی، آموزشی، سرگرمی و غیره. یکی از ویژگیهای برجسته این مدل، توانایی آن در ایجاد ویدیوهایی با حرکات طبیعی و روان است. این امر به لطف الگوریتمهای پیشرفتهای که در آن به کار رفته، امکانپذیر شده است. همچنین، این مدل قادر است جزئیات دقیقی را در ویدیوها ایجاد کند که باعث میشود ویدیوها واقعیتر و جذابتر به نظر برسند. کاربران میتوانند با استفاده از این مدل، ویدیوهایی با کیفیت بالا و با صرفهجویی در زمان و هزینه تولید کنند. این مدل به ویژه برای کسبوکارهایی که نیاز به تولید محتوای ویدیویی به صورت مداوم دارند، بسیار مفید است. با استفاده از این مدل، میتوان به راحتی ویدیوهای تبلیغاتی، آموزشی و غیره را تولید و منتشر کرد. در مجموع، مدل هوش مصنوعی v1.6-standart-image-to-video یک ابزار قدرتمند و کارآمد برای تولید ویدیوهای با کیفیت بالا از تصاویر و توضیحات متنی است. این مدل با ارائه بهبودهای چشمگیر در تطابق با دستورات متنی، کیفیت بصری و ارائه کنشهای پویا، به کاربران امکان میدهد نتایج سازگارتر و از نظر بصری جذابتری را تولید کنند. این مدل برای کسبوکارهایی که نیاز به تولید محتوای ویدیویی به صورت مداوم دارند، بسیار مفید است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار این فیلد باید `kling-video/v1.6/standard/image-to-video` باشد. مقادیر مجاز (کلیک برای کپی): |
image_url | stringRequired | یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده با Base64 که به عنوان پایه بصری یا اولین فریم برای ویدیو عمل میکند. |
ratio | string | نسبت تصویر. این پارامتر منسوخ شده است. مقادیر مجاز (کلیک برای کپی): |
aspect_ratio | string | نسبت ابعاد تصویر. این پارامتر منسوخ شده است. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که باید در ویدیو تولید شود. |
duration | integer | طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی): |
negative_prompt | string | توضیحات عناصری که باید در ویدیوی تولید شده از آنها اجتناب شود. |
cfg_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است از اینکه چقدر میخواهید مدل به دستور شما پایبند باشد. مقدار آن باید بین 0 تا 1 باشد. |
generation_id | stringRequired | شناسه تولید ویدیو. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
url = "https://api.ai-kar.com/v1/v2/generate/video/kling/generation"
payload = json.dumps({
"model": "kling-video/v1.6/standard/image-to-video",
"prompt": "Mona Lisa nervously puts on glasses with her hands and asks her off-screen friend to the left: ‘Do they suit me?’ She then tilts her head slightly to one side and then the other, so the unseen friend can better judge.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg"
})
headers = {
'Authorization': 'Bearer <YOUR_API_KEY>',
'Content-Type': 'application/json'
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}