Video Modelskling-ai

معرفی و مستندات مدل هوش مصنوعی v1-standard-text-to-video

مستندات مدل تبدیل متن به ویدیو v1-standard-text-to-video از kling-ai، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از عبارات ساده و واضح استفاده کنید.

مدل v1-standard-text-to-video از kling-ai یک مدل هوش مصنوعی است که برای تبدیل توضیحات متنی به ویدیوهای با کیفیت بالا طراحی شده است. این مدل به کاربران اجازه می‌دهد تا با ارائه یک متن توصیفی، ویدیویی کوتاه و جذاب تولید کنند. حداکثر طول ویدیوهای تولید شده توسط این مدل 5 ثانیه است. این مدل می‌تواند برای تولید محتوای تبلیغاتی، آموزشی، سرگرمی و یا حتی برای پیش‌نمایش ایده‌های خلاقانه مورد استفاده قرار گیرد. کاربران می‌توانند با استفاده از پارامترهای مختلف، جنبه‌های گوناگون ویدیو مانند نسبت تصویر، کنترل دوربین، و مدت زمان ویدیو را تنظیم کنند. همچنین، امکان تعیین یک متن منفی (negative prompt) وجود دارد تا از نمایش عناصر ناخواسته در ویدیو جلوگیری شود. پارامتر cfg_scale نیز به کاربر این امکان را می‌دهد تا میزان نزدیکی مدل به متن ورودی را کنترل کند. این مدل از طریق API قابل دسترسی است و توسعه‌دهندگان می‌توانند به راحتی آن را در برنامه‌های خود ادغام کنند. برای استفاده از این مدل، ابتدا باید یک کلید API معتبر تهیه کنید. سپس، با ارسال یک درخواست POST به endpoint مربوطه، یک وظیفه تولید ویدیو ایجاد می‌کنید. پس از ایجاد وظیفه، یک شناسه (ID) دریافت خواهید کرد که از آن برای بازیابی ویدیوی تولید شده استفاده می‌شود. فرآیند تولید ویدیو ممکن است بسته به بار سرور، چند ثانیه یا بیشتر طول بکشد. پس از تکمیل فرآیند، می‌توانید با استفاده از شناسه وظیفه، ویدیوی تولید شده را از سرور دانلود کنید. این مدل یک ابزار قدرتمند برای تولید محتوای ویدیویی است و می‌تواند به کاربران در صرفه‌جویی در زمان و هزینه تولید ویدیو کمک کند. با استفاده از این مدل، می‌توانید به راحتی ایده‌های خود را به ویدیوهای جذاب و دیدنی تبدیل کنید. این مدل به طور مداوم در حال بهبود است و در آینده قابلیت‌های بیشتری به آن اضافه خواهد شد.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید `kling-video/v1/standard/text-to-video` باشد. مقادیر مجاز (کلیک برای کپی):
type	string	نوع وظیفه. مقدار پیش‌فرض `text-to-video` است. مقادیر مجاز (کلیک برای کپی):
aspect_ratio	string	نسبت تصویر ویدیوی تولید شده. مقادیر مجاز: `16:9`, `9:16`, `1:1`. مقدار پیش‌فرض `16:9` است. مقادیر مجاز (کلیک برای کپی):
camera_control	object	پارامترهای کنترل دوربین.
prompt	stringRequired	توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
negative_prompt	string	توضیحات عناصری که می‌خواهید از نمایش آن‌ها در ویدیوی تولید شده اجتناب شود.
duration	integer	طول ویدیوی خروجی در ثانیه. مقدار مجاز: `5` یا `10`. مقادیر مجاز (کلیک برای کپی):
cfg_scale	number	مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل تا چه حد به متن ورودی پایبند باشد. مقدار پیش‌فرض `0.5` است. حداکثر مقدار مجاز `1` است.
external_task_id	string	شناسه وظیفه سفارشی.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/generate/video/kling/generation"

payload = json.dumps({
  "model": "kling-video/v1/standard/text-to-video",
  "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming."
})
headers = {
  'Authorization': 'Bearer <YOUR_API_KEY>',
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}