Video Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی veo-3-1-first-last-image-to-video

مستندات مدل تولید ویدیو از تصویر اول و آخر با هوش مصنوعی veo-3-1-first-last-image-to-video، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک دستورات فارسی ممکن است نیازمند عبارات ساده و واضح باشد.

مدل هوش مصنوعی veo-3-1-first-last-image-to-video از گوگل، یک مدل پیشرفته برای تولید ویدیوهای واقع‌گرایانه است. این مدل قادر است ویدیوهایی با کیفیت 720p و 1080p با جزئیات بصری و صوتی تولید کند. یکی از ویژگی‌های برجسته این مدل، امکان تعیین فریم اول و آخر ویدیو است که به کاربران کنترل بیشتری بر محتوای تولید شده می‌دهد. این مدل از طریق API قابل دسترسی است و به توسعه‌دهندگان اجازه می‌دهد تا به راحتی آن را در برنامه‌های خود ادغام کنند.

قابلیت‌ها و ویژگی‌ها:

1. تولید ویدیوهای با کیفیت بالا: این مدل قادر است ویدیوهایی با رزولوشن 720p و 1080p تولید کند که دارای جزئیات بصری و صوتی دقیقی هستند. این ویژگی باعث می‌شود ویدیوهای تولید شده بسیار واقع‌گرایانه و جذاب باشند.

2. تعیین فریم اول و آخر ویدیو: یکی از ویژگی‌های منحصر به فرد این مدل، امکان تعیین فریم اول و آخر ویدیو است. این قابلیت به کاربران اجازه می‌دهد تا کنترل بیشتری بر محتوای تولید شده داشته باشند و ویدیوهایی با ساختار دقیق‌تر ایجاد کنند.

3. پشتیبانی از سبک‌های مختلف: مدل veo-3-1-first-last-image-to-video از سبک‌های مختلف ویدیو پشتیبانی می‌کند. این ویژگی به کاربران امکان می‌دهد تا ویدیوهایی با سبک‌های متنوع و جذاب تولید کنند.

4. پشتیبانی از تولید صدا و دیالوگ: این مدل قادر است صدا و دیالوگ را نیز در ویدیوها تولید کند. این ویژگی باعث می‌شود ویدیوهای تولید شده زنده‌تر و جذاب‌تر به نظر برسند.

5. API قدرتمند و آسان برای استفاده: مدل veo-3-1-first-last-image-to-video از طریق یک API قدرتمند قابل دسترسی است که به توسعه‌دهندگان اجازه می‌دهد تا به راحتی آن را در برنامه‌های خود ادغام کنند. API این مدل دارای مستندات کاملی است که به کاربران کمک می‌کند تا به سرعت با نحوه استفاده از آن آشنا شوند.

6. سرعت بالا در تولید ویدیو: این مدل با استفاده از الگوریتم‌های پیشرفته، ویدیوها را با سرعت بالایی تولید می‌کند. این ویژگی به کاربران امکان می‌دهد تا در کمترین زمان ممکن ویدیوهای مورد نظر خود را ایجاد کنند.

نحوه استفاده:

برای استفاده از مدل veo-3-1-first-last-image-to-video، ابتدا باید یک حساب کاربری در پلتفرم ای آی کار (AI-KAR) ایجاد کنید و یک کلید API دریافت کنید. سپس می‌توانید با استفاده از API این مدل، درخواست‌های تولید ویدیو را ارسال کنید. برای این کار، باید فریم اول و آخر ویدیو، متن توضیحات صحنه و سایر پارامترهای مورد نظر را به API ارسال کنید. پس از ارسال درخواست، مدل ویدیو را تولید کرده و URL آن را به شما باز می‌گرداند.

موارد استفاده:

مدل veo-3-1-first-last-image-to-video می‌تواند در موارد مختلفی مورد استفاده قرار گیرد، از جمله:

* تولید ویدیوهای تبلیغاتی

* تولید ویدیوهای آموزشی

* تولید ویدیوهای سرگرمی

* تولید ویدیوهای هنری

با استفاده از این مدل، می‌توانید به راحتی ویدیوهای جذاب و با کیفیتی تولید کنید و ایده‌های خود را به واقعیت تبدیل کنید.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید ویدیو. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
image_url	stringRequired	آدرس اینترنتی تصویر ورودی برای متحرک‌سازی. رزولوشن تصویر باید 720p یا بالاتر باشد.
last_image_url	stringRequired	یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده با Base64 که به عنوان فریم آخر ویدیو استفاده می‌شود.
aspect_ratio	string	نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی):
duration	integer	طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی):
resolution	string	رزولوشن ویدیوی تولید شده. مقدار پیش‌فرض 1080p است. مقادیر مجاز (کلیک برای کپی):
generate_audio	boolean	مشخص می‌کند که آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیش‌فرض true است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/video/generations"
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
    }
    data = {
        "model": "google/veo-3.1-first-last-image-to-video",
        "prompt": "A woman looks into the camera, breathes in, then exclaims energetically, 'Hello world!'",
        "image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-1.jpeg",
        "last_image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-2.jpeg",
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 1000
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}