Video Modelspixverse

معرفی و مستندات مدل هوش مصنوعی v5-text-to-video

مستندات مدل v5-text-to-video از pixverse، ارائه شده توسط ای ای کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از عبارات ساده و واضح استفاده کنید.

مدل v5-text-to-video از pixverse یک مدل تولید ویدیو از متن است که با هدف ارائه رندرینگ سریع‌تر و نتایج با کیفیت سینمایی، واقع‌گرایانه و واضح طراحی شده است. این مدل به کاربران اجازه می‌دهد تا با ارائه یک متن توصیفی، ویدیوهای جذاب و با کیفیتی را تولید کنند. این مدل در ای ای کار (AI-KAR) ارائه شده است.

قابلیت‌ها و ویژگی‌ها:

1. تولید ویدیو از متن: این مدل قادر است با دریافت یک متن توصیفی (prompt)، ویدیویی مرتبط با آن تولید کند. این قابلیت به کاربران امکان می‌دهد تا ایده‌ها و سناریوهای خود را به ویدیو تبدیل کنند.

2. سرعت رندرینگ بالا: یکی از ویژگی‌های برجسته این مدل، سرعت بالای آن در تولید ویدیو است. این امر به کاربران اجازه می‌دهد تا در زمان کمتری به نتایج دلخواه خود دست یابند.

3. کیفیت سینمایی: مدل v5-text-to-video تلاش می‌کند تا ویدیوهایی با کیفیت سینمایی تولید کند. این به معنای ارائه ویدیوهایی با وضوح بالا، رنگ‌های زنده و جزئیات دقیق است.

4. نتایج واقع‌گرایانه: این مدل با استفاده از الگوریتم‌های پیشرفته، ویدیوهایی تولید می‌کند که تا حد امکان به واقعیت نزدیک هستند. این ویژگی به ویژه در تولید ویدیوهای آموزشی، تبلیغاتی و هنری اهمیت دارد.

5. تنظیمات متنوع: کاربران می‌توانند جنبه‌های مختلف ویدیو مانند نسبت تصویر (aspect ratio)، رزولوشن (resolution)، و طول ویدیو (duration) را تنظیم کنند. این امکان به کاربران اجازه می‌دهد تا ویدیوهایی مطابق با نیازها و ترجیحات خود تولید کنند.

6. استایل‌های مختلف: مدل v5-text-to-video از استایل‌های مختلفی مانند انیمه، انیمیشن سه‌بعدی، clay، کمیک و سایبرپانک پشتیبانی می‌کند. این تنوع به کاربران امکان می‌دهد تا ویدیوهایی با سبک‌های بصری گوناگون ایجاد کنند.

7. کنترل بیشتر با Negative Prompt: با استفاده از پارامتر negative_prompt، کاربران می‌توانند عناصری که نمی‌خواهند در ویدیو ظاهر شوند را مشخص کنند. این قابلیت به کاربران کنترل بیشتری بر خروجی نهایی می‌دهد.

8. استفاده از Seed: با تغییر مقدار seed، کاربران می‌توانند نتایج متفاوتی برای یک درخواست مشابه دریافت کنند. استفاده از یک مقدار seed ثابت، نتایج مشابهی را تضمین می‌کند.

نحوه استفاده:

برای استفاده از این مدل، کاربران باید ابتدا یک کلید API از ای ای کار (AI-KAR) دریافت کنند. سپس، با استفاده از APIهای ارائه شده، می‌توانند درخواست تولید ویدیو را ارسال کرده و پس از اتمام فرآیند، ویدیوی تولید شده را دریافت کنند. فرآیند تولید ویدیو شامل دو مرحله است: ارسال درخواست تولید ویدیو و دریافت ویدیوی تولید شده.

کاربردها:

مدل v5-text-to-video می‌تواند در زمینه‌های مختلفی مورد استفاده قرار گیرد، از جمله:

* تولید محتوای تبلیغاتی
* ایجاد ویدیوهای آموزشی
* تولید محتوای هنری و خلاقانه
* ساخت پیش‌نمایش فیلم و سریال
* تولید ویدیوهای شبکه‌های اجتماعی

با توجه به سرعت بالا، کیفیت سینمایی و قابلیت‌های متنوع، مدل v5-text-to-video ابزاری قدرتمند برای تولید ویدیو از متن است که می‌تواند نیازهای مختلف کاربران را برآورده کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار ثابت: pixverse/v5/text-to-video
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقدار پیش‌فرض: 16:9
مقادیر مجاز (کلیک برای کپی):
resolution
string
کیفیت ویدیو. ضلع کوچک‌تر فریم ویدیو، رزولوشن را تعیین می‌کند. مقدار پیش‌فرض: 720p
مقادیر مجاز (کلیک برای کپی):
duration
integer
طول ویدیوی خروجی به ثانیه. کیفیت 1080p از ویدیوهای 8 ثانیه‌ای پشتیبانی نمی‌کند.
مقادیر مجاز (کلیک برای کپی):
negative_prompt
string
توضیحات عناصری که می‌خواهید در ویدیوی تولید شده وجود نداشته باشند.
style
string
استایل ویدیوی تولید شده.
مقادیر مجاز (کلیک برای کپی):
seed
integer
مقدار seed برای تولید نتایج متفاوت با پارامترهای مشابه. استفاده از یک مقدار seed ثابت، نتایج مشابهی را تضمین می‌کند. اگر مشخص نشود، یک عدد تصادفی انتخاب می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
api_key = "<YOUR_AI-KARAPI_KEY>"

# Creating and sending a video generation task to the server
def generate_video():
    url = "https://api.ai-kar.com/v1/generate/video/pixverse/generation"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "pixverse/v5/text-to-video",
        "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming.",
        "resolution": "1080p",
        "duration": 5
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = "https://api.ai-kar.com/v1/generate/video/pixverse/generation"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Generate video
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Try to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}