Video Modelskling-ai

معرفی و مستندات مدل هوش مصنوعی v1.6-standard-text-to-video

مستندات مدل تولید ویدیو از متن v1.6-standard-text-to-video، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، پیشنهاد می‌شود از ترجمه انگلیسی استفاده کنید.

مدل v1.6-standard-text-to-video یک مدل پیشرفته تولید ویدیو با هوش مصنوعی است که برای ایجاد ویدیوهای با کیفیت بالا از متن و تصاویر طراحی شده است. این نسخه بهبودهای چشمگیری در پیروی از دستورات متنی، کیفیت بصری و ارائه اکشن‌های پویا ارائه می‌دهد و به کاربران امکان می‌دهد نتایج سازگارتر و از نظر بصری جذاب‌تری را در مقایسه با نسخه قبلی، Kling 1.5، تولید کنند. این مدل قادر است با دریافت یک متن توصیفی، صحنه‌ها، موضوعات و اکشن‌های مورد نظر را به ویدیو تبدیل کند. همچنین، امکان تعیین عناصری که باید در ویدیو از آن‌ها اجتناب شود نیز وجود دارد. مدل v1.6-standard-text-to-video با بهره‌گیری از الگوریتم‌های پیشرفته یادگیری عمیق، قادر است ویدیوهایی با جزئیات بالا و حرکات طبیعی ایجاد کند. این مدل برای کاربردهای مختلفی از جمله تولید محتوای تبلیغاتی، آموزشی، سرگرمی و هنری مناسب است. با استفاده از این مدل، کاربران می‌توانند به راحتی ایده‌های خود را به ویدیوهای جذاب و حرفه‌ای تبدیل کنند. این مدل با در نظر گرفتن مقیاس CFG (Classifier Free Guidance) میزان نزدیکی مدل به درخواست کاربر را تعیین می‌کند. این مدل از طریق API قابل دسترسی است و توسعه‌دهندگان می‌توانند از آن در برنامه‌ها و پروژه‌های خود استفاده کنند. این مدل با ارائه پارامترهای مختلف، امکان کنترل دقیق بر فرآیند تولید ویدیو را فراهم می‌کند. با استفاده از این مدل، کاربران می‌توانند ویدیوهایی با کیفیت بالا و مطابق با نیازهای خود ایجاد کنند. این مدل به طور مداوم در حال بهبود و توسعه است و در آینده قابلیت‌های جدیدی به آن اضافه خواهد شد. مدل v1.6-standard-text-to-video یک ابزار قدرتمند برای تولید ویدیو با هوش مصنوعی است که به کاربران امکان می‌دهد به راحتی و با کیفیت بالا ویدیوهای مورد نظر خود را ایجاد کنند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید ویدیو. مقادیر مجاز (کلیک برای کپی):
ratio	string	نسبت تصویر ویدیو. این پارامتر منسوخ شده است، از `aspect_ratio` استفاده کنید. مقادیر مجاز (کلیک برای کپی):
aspect_ratio	string	نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	توضیحات متنی صحنه، موضوع یا اکشنی که می‌خواهید در ویدیو تولید شود.
duration	integer	طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی):
negative_prompt	string	توضیحات عناصری که باید در ویدیوی تولید شده از آن‌ها اجتناب شود.
cfg_scale	number	مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد. مقدار باید بین 0 و 1 باشد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/v2/generate/video/kling/generation"

payload = json.dumps({
  "model": "kling-video/v1.6/standard/text-to-video",
  "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming."
})
headers = {
  'Authorization': 'Bearer <YOUR_API_KEY>',
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}