Video Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی veo-3-fast-image-to-video

مستندات مدل تولید ویدیو از تصویر veo-3-fast-image-to-video از گوگل، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل در درک متون فارسی عملکرد متوسطی دارد. برای دریافت بهترین نتیجه، توصیه می‌شود توضیحات متنی به زبان انگلیسی ارائه شوند.

معرفی مدل هوش مصنوعی veo-3-fast-image-to-video

مدل veo-3-fast-image-to-video یک مدل پیشرفته تولید ویدیو از تصویر است که توسط گوگل توسعه داده شده است. این مدل قادر است ویدیوهای واقع‌گرایانه با کیفیت 720p و 1080p با جزئیات بصری و صوتی تولید کند. این مدل به طور خاص برای سرعت و هزینه بهینه شده است و در مقایسه با مدل Veo 3 (Image-to-Video) عملکرد بهتری دارد.

این مدل به شما امکان می‌دهد تا با ارائه یک تصویر و یک توضیح متنی، ویدیویی با کیفیت بالا تولید کنید. این فرایند شامل دو مرحله اصلی است: ابتدا یک درخواست تولید ویدیو به سرور ارسال می‌شود و یک شناسه تولید (generation ID) دریافت می‌کنید. سپس با استفاده از این شناسه، می‌توانید وضعیت تولید ویدیو را بررسی کرده و در صورت تکمیل، ویدیوی تولید شده را دریافت کنید.

این مدل می‌تواند در زمینه‌های مختلفی مورد استفاده قرار گیرد، از جمله:

تولید محتوای تبلیغاتی
ایجاد ویدیوهای آموزشی
تولید ویدیوهای سرگرمی
تبدیل تصاویر استاتیک به ویدیوهای پویا

با استفاده از این مدل، می‌توانید به راحتی ایده‌های خود را به ویدیوهای جذاب و با کیفیت تبدیل کنید. این مدل با بهره‌گیری از الگوریتم‌های پیشرفته هوش مصنوعی، قادر است ویدیوهایی با جزئیات بالا و حرکات طبیعی تولید کند. همچنین، امکان اضافه کردن صدا به ویدیوها نیز وجود دارد که تجربه کاربری را بهبود می‌بخشد.

برای استفاده از این مدل، نیاز به یک کلید API دارید. می‌توانید از راهنمای شروع سریع ما برای دریافت کلید API استفاده کنید. پس از دریافت کلید API، می‌توانید با استفاده از APIهای ارائه شده، درخواست‌های تولید ویدیو را ارسال کرده و ویدیوهای تولید شده را دریافت کنید.

این مدل از پارامترهای مختلفی برای کنترل فرایند تولید ویدیو پشتیبانی می‌کند، از جمله نسبت تصویر، رزولوشن، مدت زمان ویدیو، و توضیحات منفی برای جلوگیری از نمایش عناصر ناخواسته در ویدیو. همچنین، امکان تعیین یک مقدار seed برای تولید نتایج مشابه برای درخواست‌های یکسان وجود دارد.

با استفاده از مدل veo-3-fast-image-to-video، می‌توانید به راحتی و با سرعت بالا ویدیوهای با کیفیت و واقع‌گرایانه تولید کنید و ایده‌های خود را به واقعیت تبدیل کنید. این مدل یک ابزار قدرتمند برای تولید محتوای ویدیویی است که می‌تواند در زمینه‌های مختلفی مورد استفاده قرار گیرد.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید ویدیو. مقدار ثابت: google/veo-3.0-i2v-fast مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
image_url	stringRequired	یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده با Base64 که به عنوان پایه بصری یا اولین فریم برای ویدیو استفاده می‌شود.
aspect_ratio	string	نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی):
resolution	string	رزولوشن ویدیوی تولید شده. مقدار پیش‌فرض: 720P مقادیر مجاز (کلیک برای کپی):
duration	integer	مدت زمان ویدیوی خروجی به ثانیه. مقادیر مجاز (کلیک برای کپی):
negative_prompt	string	توضیحات عناصری که باید در ویدیوی تولید شده از آنها اجتناب شود.
seed	integer	تغییر مقدار seed یک راه برای دریافت نتایج مختلف برای پارامترهای درخواست یکسان است. استفاده از مقدار یکسان برای یک درخواست مشابه نتایج مشابهی تولید می‌کند. اگر مشخص نشود، یک عدد تصادفی انتخاب می‌شود.
enhance_prompt	boolean	اینکه آیا تولید ویدیو بهبود یابد یا خیر. مقدار پیش‌فرض: true
generate_audio	boolean	اینکه آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیش‌فرض: true

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# replace <YOUR_AI-KARAPI_KEY> with your actual ای آی کار (AI-KAR) key
api_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/generate/video/google/generation"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "google/veo-3.0-i2v-fast",
        "prompt": "The woman puts on glasses with her hands and then sighs and says slowly: 'Well...'.",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        # print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/generate/video/google/generation"
    params = {
        "generation_id": gen_id,
    }
    # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    # print("Generation:", response.json())
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}