Video Modelskling-ai

معرفی و مستندات مدل هوش مصنوعی v2-master-text-to-video

مستندات مدل تولید ویدیو از متن v2-master-text-to-video از Kling AI، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی در سطح متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از توضیحات متنی انگلیسی استفاده کنید، اما استفاده از توضیحات فارسی نیز می‌تواند نتایج قابل قبولی ارائه دهد.

مدل v2-master-text-to-video از Kling AI یک مدل پیشرفته تولید ویدیو است که به کاربران اجازه می‌دهد تا با استفاده از توضیحات متنی، ویدیوهای با کیفیت بالا تولید کنند. این مدل، که توسط ای آی کار (AI-KAR) ارائه شده است، قادر است صحنه‌ها، شخصیت‌ها و رویدادهای مختلف را بر اساس ورودی متنی کاربر ایجاد کند. در مقایسه با مدل v1.6، این نسخه جدیدتر دقت بیشتری در تطابق با درخواست کاربر دارد و نتایج بصری جذاب‌تر و پویاتری ارائه می‌دهد. این مدل به ویژه برای تولیدکنندگان محتوا، بازاریابان، و هنرمندانی که به دنبال راهی سریع و کارآمد برای تولید ویدیوهای سفارشی هستند، بسیار مناسب است. با استفاده از این مدل، کاربران می‌توانند به راحتی ایده‌های خود را به ویدیوهای واقعی تبدیل کنند، بدون نیاز به تجهیزات گران‌قیمت یا مهارت‌های تخصصی در زمینه فیلم‌سازی. این مدل از طریق API قابل دسترسی است و به توسعه‌دهندگان اجازه می‌دهد تا آن را در برنامه‌ها و پلتفرم‌های خود ادغام کنند. برای شروع کار با این مدل، کاربران باید یک کلید API معتبر داشته باشند. فرآیند تولید ویدیو شامل دو مرحله است: ابتدا، یک درخواست تولید ویدیو به سرور ارسال می‌شود که یک شناسه تولید (generation ID) برمی‌گرداند. سپس، با استفاده از این شناسه، می‌توان وضعیت تولید ویدیو را بررسی کرد و در صورت تکمیل، ویدیوی تولید شده را دریافت کرد. این مدل از پارامترهای مختلفی برای کنترل جنبه‌های مختلف ویدیو، مانند نسبت تصویر، طول ویدیو، و میزان تطابق با درخواست متنی، پشتیبانی می‌کند. همچنین، کاربران می‌توانند از پارامتر negative_prompt برای مشخص کردن عناصری که باید در ویدیو اجتناب شوند، استفاده کنند. با توجه به پیچیدگی فرآیند تولید ویدیو، زمان تولید ممکن است بسته به طول ویدیو و سایر پارامترها متفاوت باشد. به طور کلی، تولید یک ویدیوی 5 ثانیه‌ای ممکن است حدود 5-6 دقیقه و تولید یک ویدیوی 10 ثانیه‌ای ممکن است حدود 11-14 دقیقه طول بکشد. ای آی کار (AI-KAR) این مدل را به عنوان یک ابزار قدرتمند برای تولید ویدیوهای خلاقانه و جذاب به کاربران پیشنهاد می‌کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید 'klingai/v2-master-text-to-video' باشد.
مقادیر مجاز (کلیک برای کپی):
type
string
نوع تولید ویدیو. مقدار این پارامتر باید 'text-to-video' باشد.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقادیر مجاز: '16:9'، '9:16'، '1:1'. مقدار پیش‌فرض '16:9' است.
مقادیر مجاز (کلیک برای کپی):
camera_control
object
پارامترهای کنترل دوربین.
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
negative_prompt
string
توضیحات عناصری که می‌خواهید در ویدیوی تولید شده از آن‌ها اجتناب شود.
duration
integer
طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز: 5، 10.
مقادیر مجاز (کلیک برای کپی):
cfg_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما نزدیک باشد. مقدار پیش‌فرض 0.5 است و حداکثر مقدار آن 1 است.
external_task_id
string
شناسه سفارشی برای وظیفه.
generation_id
stringRequired
شناسه تولید ویدیو که از درخواست اولیه دریافت شده است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time
base_url = "https://api.ai-kar.com/v1"
api_key = "<YOUR_AI-KARAPI_KEY>"
# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/generate/video/kling/generation"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "klingai/v2-master-text-to-video",
        "prompt": "A cheerful white raccoon running through a sequoia forest",
        "aspect_ratio": "16:9",
        "duration": "5",
        "cfg_scale": 0.9
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/generate/video/kling/generation"
    params = {
        "generation_id": gen_id,
    }
    # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()
def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Gen_ID:  ", gen_id)
    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 1000
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None
if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}