Video Modelsopenai

معرفی و مستندات مدل هوش مصنوعی sora-2-t2v

مستندات مدل sora-2-t2v برای تولید ویدیو از متن، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از توضیحات انگلیسی استفاده کنید.

مدل sora-2-t2v یک مدل پیشرفته تولید ویدیو از متن است که توسط OpenAI توسعه یافته و از طریق پلتفرم ای آی کار (AI-KAR) در دسترس قرار گرفته است. این مدل قادر است با دریافت یک توضیح متنی (prompt)، ویدیوهای با کیفیت بالا و با جزئیات دقیق تولید کند. sora-2-t2v نه تنها قادر به تولید ویدیوهای کوتاه است، بلکه می‌تواند صدا را نیز با ویدیو همگام‌سازی کند، که این ویژگی آن را از بسیاری از مدل‌های مشابه متمایز می‌کند. این مدل می‌تواند سناریوهای مختلفی را شبیه‌سازی کند، از جمله صحنه‌های طبیعی، حرکات پیچیده دوربین، و تعاملات بین اشیاء و شخصیت‌ها. یکی از ویژگی‌های برجسته sora-2-t2v، توانایی آن در درک و تفسیر دقیق دستورات متنی است. این مدل می‌تواند مفاهیم انتزاعی و توصیفات دقیق را به ویدیوهای واقعی تبدیل کند. به عنوان مثال، با دادن دستور "یک اژدهای شرور در دوردست بالای بلندترین کوه ظاهر می‌شود، سپس با آرواره‌های باز به سمت دوربین می‌آید و دندان‌های بزرگش را نشان می‌دهد. ما می‌بینیم که دارد می‌آید."، مدل می‌تواند یک ویدیوی با کیفیت از این صحنه تولید کند. sora-2-t2v همچنین امکان تنظیم طول ویدیو و نسبت تصویر را فراهم می‌کند. کاربران می‌توانند طول ویدیو را بین 4، 8 و 12 ثانیه انتخاب کنند و نسبت تصویر را بین 16:9 و 9:16 تنظیم کنند. همچنین، امکان انتخاب رزولوشن ویدیو نیز وجود دارد که به طور پیش‌فرض روی 720p تنظیم شده است. این مدل در زمینه‌های مختلفی کاربرد دارد، از جمله تولید محتوای تبلیغاتی، ساخت فیلم‌های کوتاه، ایجاد جلوه‌های ویژه، و آموزش. با استفاده از sora-2-t2v، کاربران می‌توانند به راحتی و با کمترین هزینه، ویدیوهای با کیفیت بالا تولید کنند. ای آی کار (AI-KAR) این مدل را به همراه مستندات کامل و مثال‌های کاربردی ارائه می‌دهد تا کاربران بتوانند به بهترین شکل از آن استفاده کنند. این مدل به طور مداوم در حال بهبود است و ویژگی‌های جدیدی به آن اضافه می‌شود تا نیازهای کاربران را به بهترین شکل برآورده کند. برای استفاده از این مدل، کافی است یک حساب کاربری در ای آی کار (AI-KAR) ایجاد کنید و کلید API خود را دریافت کنید. سپس می‌توانید با استفاده از API، درخواست‌های تولید ویدیو را ارسال کنید و ویدیوهای تولید شده را دریافت کنید.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید `openai/sora-2-t2v` باشد.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
duration
integer
طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز: 4، 8، 12.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقدار پیش‌فرض: 16:9. مقادیر مجاز: 16:9، 9:16.
مقادیر مجاز (کلیک برای کپی):
resolution
string
رزولوشن ویدیوی خروجی. عدد به ضلع کوچک‌تر بر حسب پیکسل اشاره دارد. مقدار پیش‌فرض: 720p. مقادیر مجاز: 720p.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
api_key = "<YOUR_AI-KARAPI_KEY>"

# Creating and sending a video generation task to the server
def generate_video():
    url = "https://api.ai-kar.com/v1/video/generations"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "openai/sora-2-t2v",
        "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming.",
        "resolution": "720p",
        "duration": 4
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = "https://api.ai-kar.com/v1/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Generate video
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)
    # Try to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}