Video Modelsopenai

معرفی و مستندات مدل هوش مصنوعی sora-2-pro-i2v

مستندات مدل sora-2-pro-i2v از openai، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک دستورات فارسی ممکن است نیازمند عبارات واضح و بدون ابهام باشد.

مدل sora-2-pro-i2v یک مدل پیشرفته تولید رسانه است که توسط OpenAI توسعه داده شده است. این مدل قادر است ویدیوهایی با کیفیت بالا و همراه با صدای هماهنگ تولید کند. این مدل به عنوان یکی از پیشرفته‌ترین مدل‌های تولید ویدیو در دسترس قرار دارد و می‌تواند برای تولید محتوای ویدیویی متنوعی مورد استفاده قرار گیرد. با استفاده از این مدل، کاربران می‌توانند با ارائه یک تصویر مرجع و یک متن توصیفی (prompt)، ویدیویی با محتوای مورد نظر خود تولید کنند. مدل sora-2-pro-i2v از تکنیک‌های پیشرفته هوش مصنوعی برای تفسیر متن و تصویر ورودی استفاده می‌کند و ویدیویی با کیفیت و مرتبط با ورودی‌ها تولید می‌کند. این مدل از رزولوشن‌های مختلف و نسبت‌های تصویر گوناگون پشتیبانی می‌کند، که به کاربران امکان می‌دهد ویدیوهایی با مشخصات دلخواه خود ایجاد کنند. یکی از ویژگی‌های برجسته این مدل، قابلیت تولید ویدیوهایی با مدت زمان مشخص است. کاربران می‌توانند طول ویدیوی خروجی را بین 4، 8 و 12 ثانیه تنظیم کنند. همچنین، این مدل از نسبت‌های تصویر 16:9 و 9:16 پشتیبانی می‌کند، که امکان تولید ویدیوهایی با فرمت‌های مختلف را فراهم می‌سازد. رزولوشن‌های پشتیبانی شده شامل 720p و 1080p است، که به کاربران اجازه می‌دهد ویدیوهایی با کیفیت‌های مختلف ایجاد کنند. برای استفاده از این مدل، کاربران باید ابتدا یک کلید API معتبر از ای آی کار (AI-KAR) دریافت کنند. سپس، با استفاده از API ارائه شده، می‌توانند درخواست تولید ویدیو را به سرور ارسال کنند. فرآیند تولید ویدیو شامل دو مرحله است: ابتدا یک درخواست تولید ویدیو به سرور ارسال می‌شود و یک شناسه تولید (generation ID) دریافت می‌شود. سپس، با استفاده از این شناسه، می‌توان وضعیت تولید ویدیو را بررسی کرد و پس از تکمیل فرآیند، ویدیوی تولید شده را از سرور دریافت کرد. این مدل برای تولید محتوای ویدیویی در زمینه‌های مختلفی مانند تبلیغات، آموزش، سرگرمی و غیره کاربرد دارد. با استفاده از sora-2-pro-i2v، کاربران می‌توانند به راحتی و با کمترین هزینه، ویدیوهایی با کیفیت و جذاب تولید کنند. این مدل به عنوان یک ابزار قدرتمند برای تولید محتوای ویدیویی، به کاربران امکان می‌دهد تا ایده‌های خلاقانه خود را به واقعیت تبدیل کنند و محتوایی منحصر به فرد و جذاب ایجاد کنند. ای آی کار (AI-KAR) با ارائه این مدل، به کاربران امکان می‌دهد تا از آخرین دستاوردهای هوش مصنوعی در زمینه تولید ویدیو بهره‌مند شوند و محتوایی با کیفیت و جذاب تولید کنند. این مدل به طور مداوم در حال بهبود و توسعه است تا بتواند نیازهای کاربران را به بهترین شکل ممکن برآورده کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید 'openai/sora-2-pro-i2v' باشد.
مقادیر مجاز (کلیک برای کپی):
image_url
stringRequired
آدرس URL یا تصویر کدگذاری شده Base64 که به عنوان فریم اولیه برای تولید ویدیو استفاده می‌شود. ابعاد تصویر باید با رزولوشن و نسبت تصویر انتخاب شده مطابقت داشته باشد.
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
duration
integer
طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز: 4، 8 یا 12.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقدار پیش‌فرض: 16:9. مقادیر مجاز: 16:9 یا 9:16.
مقادیر مجاز (کلیک برای کپی):
resolution
string
رزولوشن ویدیوی خروجی. مقدار پیش‌فرض: 1080p. مقادیر مجاز: 720p یا 1080p.
مقادیر مجاز (کلیک برای کپی):
generation_id
stringRequired
شناسه تولید ویدیو که از درخواست اولیه دریافت شده است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

api_key = '<YOUR_AI-KARAPI_KEY>'

def generate_video():
    url = 'https://api.ai-kar.com/v1/video/generations'
    headers = {
        'Authorization': f'Bearer {api_key}',
    }
    data = {
        'model': 'openai/sora-2-pro-i2v',
        'prompt': 'She turns around and smiles, then slowly walks out of the frame.',
        'image_url': 'https://cdn.openai.com/API/docs/images/sora/woman_skyline_original_720p.jpeg',
        'resolution': '720p',
        'duration': 4
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f'Error: {response.status_code} - {response.text}')
    else:
        response_data = response.json()
        print(response_data)
        return response_data

def get_video(gen_id):
    url = 'https://api.ai-kar.com/v1/video/generations'
    params = {
        'generation_id': gen_id,
    }
    headers = {
        'Authorization': f'Bearer {api_key}',
        'Content-Type': 'application/json'
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    gen_response = generate_video()
    gen_id = gen_response.get('id')
    print('Generation ID:  ', gen_id)

    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print('Error: No response from API')
                break
            status = response_data.get('status')
            print('Status:', status)
            if status == 'waiting' or status == 'active' or  status == 'queued' or status == 'generating':
                print('Still waiting... Checking again in 10 seconds.')
                time.sleep(10)
            else:
                print('Processing complete:/n', response_data)
                return response_data
        print('Timeout reached. Stopping.')
        return None

if __name__ == '__main__':
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "text",
  "status": "queued",
  "video": {
    "url": "https://example.com",
    "duration": 1
  },
  "duration": 1,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 1
    }
  }
}