Video Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی veo-3-1-image-to-video-fast

مستندات مدل تولید ویدیو از تصویر veo-3-1-image-to-video-fast، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی در حد متوسط پشتیبانی می‌کند. توضیحات فارسی در prompt ممکن است به خوبی در ویدیو منعکس نشوند و نیاز به آزمایش و تنظیم دقیق دارد.

معرفی مدل veo-3-1-image-to-video-fast

مدل veo-3-1-image-to-video-fast یک مدل هوش مصنوعی پیشرفته است که توسط گوگل توسعه یافته و برای تولید ویدیوهای کوتاه و با کیفیت از روی یک تصویر ورودی طراحی شده است. این مدل قادر است ویدیوهایی با رزولوشن 720p و 1080p تولید کند که دارای جزئیات بصری دقیق و صدای هماهنگ هستند. یکی از ویژگی‌های برجسته این مدل، پشتیبانی از سبک‌های مختلف ویدئویی و حتی تولید دیالوگ است، که آن را به ابزاری قدرتمند برای تولید محتوای خلاقانه تبدیل می‌کند.

این مدل با دریافت یک تصویر و یک توضیح متنی (prompt) به عنوان ورودی، می‌تواند یک ویدیوی 8 ثانیه‌ای تولید کند. این ویدیو می‌تواند شامل حرکات و تغییراتی در تصویر اولیه باشد که با توضیحات متنی ارائه شده هماهنگ است. به عنوان مثال، می‌توان از این مدل خواست تا تصویری از یک شخص را به ویدیویی تبدیل کند که در آن شخص در حال انجام یک فعالیت خاص است یا دیالوگی را بیان می‌کند.

یکی از کاربردهای اصلی این مدل، تولید محتوای تبلیغاتی و آموزشی است. با استفاده از این مدل، می‌توان به سرعت و به آسانی ویدیوهای تبلیغاتی جذاب و ویدیوهای آموزشی تعاملی تولید کرد. همچنین، این مدل می‌تواند در تولید محتوای سرگرم‌کننده و خلاقانه برای شبکه‌های اجتماعی و پلتفرم‌های ویدیویی مورد استفاده قرار گیرد.

برای استفاده از این مدل، ابتدا باید یک کلید API از ای آی کار (AI-KAR) دریافت کنید. سپس، با استفاده از API ارائه شده، می‌توانید درخواست تولید ویدیو را به سرور ارسال کنید. این فرآیند شامل دو مرحله است: ابتدا یک درخواست برای ایجاد و ارسال وظیفه تولید ویدیو به سرور ارسال می‌شود که یک شناسه تولید (generation ID) را برمی‌گرداند. سپس، با استفاده از این شناسه، می‌توانید ویدیوی تولید شده را از سرور درخواست کنید.

مدل veo-3-1-image-to-video-fast با ارائه امکانات پیشرفته و کیفیت بالای ویدیوهای تولیدی، یک ابزار بسیار ارزشمند برای تولیدکنندگان محتوا، بازاریابان و هر کسی است که به دنبال تولید ویدیوهای جذاب و خلاقانه با استفاده از هوش مصنوعی است. این مدل با سرعت بالا و سهولت استفاده، فرآیند تولید ویدیو را ساده‌تر و کارآمدتر می‌کند و به کاربران امکان می‌دهد تا ایده‌های خود را به سرعت به واقعیت تبدیل کنند.

با استفاده از این مدل، می‌توانید ویدیوهایی با سبک‌های مختلف و با جزئیات بصری و صوتی متنوع تولید کنید. این امکان به شما اجازه می‌دهد تا محتوای خود را با توجه به نیازها و سلیقه‌های مخاطبان خود سفارشی‌سازی کنید و ویدیوهایی تولید کنید که بیشترین تاثیر را داشته باشند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید google/veo-3.1-i2v-fast باشد.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود. این متن باید به صورت واضح و دقیق بیان شود.
image_url
stringRequired
آدرس اینترنتی تصویر ورودی که می‌خواهید آن را به ویدیو تبدیل کنید. رزولوشن تصویر باید 720p یا بالاتر باشد.
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقادیر قابل قبول: 16:9 یا 9:16.
مقادیر مجاز (کلیک برای کپی):
duration
integer
طول ویدیوی خروجی به ثانیه. مقدار قابل قبول: 8.
مقادیر مجاز (کلیک برای کپی):
resolution
string
رزولوشن ویدیوی خروجی. مقدار پیش‌فرض 1080p است. مقادیر قابل قبول: 720p یا 1080p.
مقادیر مجاز (کلیک برای کپی):
generate_audio
boolean
مشخص می‌کند که آیا برای ویدیو صدا تولید شود یا خیر. مقدار پیش‌فرض true است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/video/generations"
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
    }
    data = {
        "model": "google/veo-3.1-i2v-fast",
        "prompt": "The woman puts on glasses with her hands and then sighs and says slowly: 'Well...'.",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 1000
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}