Video Modelskling-ai

معرفی و مستندات مدل هوش مصنوعی v1.6-standart-image-to-video

مستندات مدل تبدیل تصویر به ویدیو v1.6-standart، توسعه یافته توسط ای ای کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای بهترین نتیجه، توصیه می‌شود از توضیحات انگلیسی استفاده کنید.

مدل هوش مصنوعی v1.6-standart-image-to-video یک مدل پیشرفته تولید ویدیو است که توسط Kuaishou Technology توسعه یافته است. این مدل برای ایجاد ویدیوهای با کیفیت بالا از تصاویر و توضیحات متنی طراحی شده است. این نسخه بهبودهای چشمگیری در تطابق با دستورات متنی، کیفیت بصری و ارائه کنش‌های پویا ارائه می‌دهد و به کاربران امکان می‌دهد نتایج سازگارتر و از نظر بصری جذاب‌تری را در مقایسه با نسخه قبلی، Kling 1.5، تولید کنند. این مدل با دریافت یک تصویر و یک توضیح متنی، قادر است ویدیویی کوتاه و مرتبط با محتوای ورودی تولید کند. این فرایند شامل تحلیل تصویر و متن، ترکیب آن‌ها و تولید فریم‌های ویدیویی است که با هم یک سکانس ویدیویی معنادار را تشکیل می‌دهند. این مدل می‌تواند برای تولید انواع مختلف ویدیوها مورد استفاده قرار گیرد، از جمله ویدیوهای تبلیغاتی، آموزشی، سرگرمی و غیره. یکی از ویژگی‌های برجسته این مدل، توانایی آن در ایجاد ویدیوهایی با حرکات طبیعی و روان است. این امر به لطف الگوریتم‌های پیشرفته‌ای که در آن به کار رفته، امکان‌پذیر شده است. همچنین، این مدل قادر است جزئیات دقیقی را در ویدیوها ایجاد کند که باعث می‌شود ویدیوها واقعی‌تر و جذاب‌تر به نظر برسند. کاربران می‌توانند با استفاده از این مدل، ویدیوهایی با کیفیت بالا و با صرفه‌جویی در زمان و هزینه تولید کنند. این مدل به ویژه برای کسب‌وکارهایی که نیاز به تولید محتوای ویدیویی به صورت مداوم دارند، بسیار مفید است. با استفاده از این مدل، می‌توان به راحتی ویدیوهای تبلیغاتی، آموزشی و غیره را تولید و منتشر کرد. در مجموع، مدل هوش مصنوعی v1.6-standart-image-to-video یک ابزار قدرتمند و کارآمد برای تولید ویدیوهای با کیفیت بالا از تصاویر و توضیحات متنی است. این مدل با ارائه بهبودهای چشمگیر در تطابق با دستورات متنی، کیفیت بصری و ارائه کنش‌های پویا، به کاربران امکان می‌دهد نتایج سازگارتر و از نظر بصری جذاب‌تری را تولید کنند. این مدل برای کسب‌وکارهایی که نیاز به تولید محتوای ویدیویی به صورت مداوم دارند، بسیار مفید است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این فیلد باید `kling-video/v1.6/standard/image-to-video` باشد.
مقادیر مجاز (کلیک برای کپی):
image_url
stringRequired
یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده با Base64 که به عنوان پایه بصری یا اولین فریم برای ویدیو عمل می‌کند.
ratio
string
نسبت تصویر. این پارامتر منسوخ شده است.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت ابعاد تصویر. این پارامتر منسوخ شده است.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که باید در ویدیو تولید شود.
duration
integer
طول ویدیوی خروجی بر حسب ثانیه.
مقادیر مجاز (کلیک برای کپی):
negative_prompt
string
توضیحات عناصری که باید در ویدیوی تولید شده از آنها اجتناب شود.
cfg_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است از اینکه چقدر می‌خواهید مدل به دستور شما پایبند باشد. مقدار آن باید بین 0 تا 1 باشد.
generation_id
stringRequired
شناسه تولید ویدیو.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/v2/generate/video/kling/generation"

payload = json.dumps({
  "model": "kling-video/v1.6/standard/image-to-video",
  "prompt": "Mona Lisa nervously puts on glasses with her hands and asks her off-screen friend to the left: ‘Do they suit me?’ She then tilts her head slightly to one side and then the other, so the unseen friend can better judge.",
  "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg"
})
headers = {
  'Authorization': 'Bearer <YOUR_API_KEY>',
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}