Video Modelsltxv

معرفی و مستندات مدل هوش مصنوعی ltxv-2

مستندات مدل تولید ویدیو ltxv-2 از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از prompt های انگلیسی استفاده کنید، اما prompt های فارسی نیز قابل قبول هستند.

مدل ltxv-2 از مجموعه مدل‌های ltxv، یک مدل پیشرفته تولید ویدیو است که توسط ای آی کار (AI-KAR) توسعه داده شده است. این مدل قادر است ویدیوهای واقع‌گرایانه با طول‌های 6، 8 و 10 ثانیه و رزولوشن تا 4K تولید کند. ویژگی برجسته این مدل، تولید ویدیوهایی با جزئیات بصری بالا و صدای با کیفیت است. ltxv-2 با بهره‌گیری از تکنیک‌های نوین هوش مصنوعی، قادر است صحنه‌ها، اشیاء و حرکات پیچیده را به صورت طبیعی و باورپذیر شبیه‌سازی کند. این مدل برای تولید محتوای ویدیویی در زمینه‌های مختلف از جمله تبلیغات، آموزش، سرگرمی و هنر مناسب است. کاربران می‌توانند با ارائه یک متن توصیفی (prompt)، ویدیویی با محتوای دلخواه خود تولید کنند. همچنین، امکان استفاده از یک تصویر به عنوان پایه یا فریم اول ویدیو نیز وجود دارد. ltxv-2 به کاربران این امکان را می‌دهد تا طول ویدیو، رزولوشن، نسبت تصویر و نرخ فریم را تنظیم کنند. علاوه بر این، کاربران می‌توانند انتخاب کنند که آیا ویدیو دارای صدا باشد یا خیر. این مدل با ارائه API ساده و کاربردی، امکان ادغام آسان با سایر سیستم‌ها و برنامه‌ها را فراهم می‌کند. برای استفاده از ltxv-2، کاربران ابتدا باید یک کلید API از ای آی کار (AI-KAR) دریافت کنند. سپس، با استفاده از API، یک درخواست تولید ویدیو به سرور ارسال می‌کنند. سرور یک شناسه تولید (generation ID) را برمی‌گرداند. کاربران می‌توانند با استفاده از این شناسه، وضعیت تولید ویدیو را پیگیری کنند و پس از تکمیل، ویدیوی تولید شده را از سرور دریافت کنند. مدل ltxv-2 با ارائه کیفیت بالا، انعطاف‌پذیری و سهولت استفاده، یک ابزار قدرتمند برای تولید محتوای ویدیویی است. این مدل به طور مداوم در حال بهبود و توسعه است تا نیازهای کاربران را به بهترین شکل ممکن برآورده کند. با استفاده از ltxv-2، کاربران می‌توانند ایده‌های خلاقانه خود را به ویدیوهای جذاب و حرفه‌ای تبدیل کنند. این مدل با پشتیبانی از رزولوشن‌های بالا، امکان تولید ویدیوهایی با کیفیت سینمایی را فراهم می‌کند. همچنین، با قابلیت تولید صدا، کاربران می‌توانند ویدیوهایی با تجربه کاربری غنی‌تر ایجاد کنند. ltxv-2 یک انتخاب عالی برای تولیدکنندگان محتوا، بازاریابان، هنرمندان و هر کسی است که به دنبال تولید ویدیوهای با کیفیت و جذاب است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید ltxv/ltxv-2 باشد.
مقادیر مجاز (کلیک برای کپی):
image_url
string
یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده به صورت Base64 که به عنوان پایه بصری یا فریم اول برای ویدیو استفاده می‌شود.
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
duration
integer
طول ویدیوی خروجی بر حسب ثانیه.
مقادیر مجاز (کلیک برای کپی):
resolution
string
رزولوشن ویدیوی خروجی. عدد به ضلع کوچکتر بر حسب پیکسل اشاره دارد. مقدار پیش‌فرض 1080p است.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقدار پیش‌فرض 16:9 است.
مقادیر مجاز (کلیک برای کپی):
fps
integer
فریم در ثانیه ویدیوی تولید شده.
مقادیر مجاز (کلیک برای کپی):
generate_audio
boolean
مشخص می‌کند که آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیش‌فرض true است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
api_key = "<YOUR_AI-KARAPI_KEY>"

# Creating and sending a video generation task to the server
def generate_video():
    url = "https://api.ai-kar.com/v1/v2/video/generations"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "ltxv/ltxv-2",
        "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming. He's roaring: WHERE ARE MY TREASURES?",
        "duration": 6
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = "https://api.ai-kar.com/v1/v2/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Generate video
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Try to retrieve the video from the server every 15 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            if status in ["waiting", "active", "queued", "generating"]:
                print(f"Status: {status}. Checking again in 15 seconds.")
                time.sleep(15)
            else:
                print("Processing complete:\n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}