Video Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی veo-3-1-first-last-image-to-video-fast

مستندات مدل تولید ویدیو از روی دو تصویر با هوش مصنوعی veo-3-1-first-last-image-to-video-fast، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک دستورات فارسی ممکن است نیازمند کمی ویرایش و ساده‌سازی باشد تا بهترین نتیجه حاصل شود.

مدل هوش مصنوعی veo-3-1-first-last-image-to-video-fast، یک مدل پیشرفته تولید ویدیو است که توسط گوگل توسعه یافته و اکنون از طریق ای آی کار (AI-KAR) در دسترس است. این مدل قادر است ویدیوهای واقع‌گرایانه با کیفیت 720p و 1080p با جزئیات بصری و صوتی تولید کند. این مدل از دو تصویر، یکی به عنوان فریم اول و دیگری به عنوان فریم آخر، و یک توضیح متنی (prompt) برای تولید ویدیو استفاده می‌کند. این قابلیت به کاربران اجازه می‌دهد تا با کمترین تلاش، ویدیوهایی با سبک‌های مختلف و حتی با پشتیبانی از دیالوگ ایجاد کنند. یکی از ویژگی‌های برجسته این مدل، سرعت بالای آن در تولید ویدیو است. با استفاده از الگوریتم‌های بهینه‌سازی شده، این مدل می‌تواند در کمترین زمان ممکن ویدیوهای با کیفیت بالا تولید کند. این ویژگی برای کاربرانی که نیاز به تولید سریع ویدیو دارند، بسیار حائز اهمیت است. مدل veo-3-1-first-last-image-to-video-fast از طریق API قابل دسترسی است و کاربران می‌توانند با ارسال درخواست‌های HTTP، ویدیوهای مورد نظر خود را تولید کنند. API این مدل به گونه‌ای طراحی شده است که استفاده از آن بسیار آسان و کاربرپسند باشد. کاربران می‌توانند با استفاده از پارامترهای مختلف، ویژگی‌های ویدیو تولید شده را کنترل کنند. این مدل از پارامترهای مختلفی برای کنترل ویژگی‌های ویدیو پشتیبانی می‌کند. به عنوان مثال، کاربران می‌توانند نسبت تصویر (aspect ratio)، مدت زمان ویدیو (duration)، و کیفیت تصویر (resolution) را تعیین کنند. همچنین، این مدل قابلیت تولید صدا برای ویدیو را نیز دارد. کاربران می‌توانند با فعال کردن گزینه generate_audio، صدای مناسبی برای ویدیوی خود تولید کنند. برای استفاده از این مدل، کاربران باید ابتدا یک کلید API از ای آی کار (AI-KAR) دریافت کنند. پس از دریافت کلید API، کاربران می‌توانند با استفاده از API، درخواست‌های تولید ویدیو را ارسال کنند. فرآیند تولید ویدیو شامل دو مرحله است: ابتدا یک درخواست برای ایجاد یک وظیفه تولید ویدیو به سرور ارسال می‌شود و یک شناسه تولید (generation ID) دریافت می‌شود. سپس، با استفاده از این شناسه، کاربران می‌توانند وضعیت وظیفه تولید ویدیو را بررسی کنند و پس از تکمیل، ویدیوی تولید شده را دریافت کنند. این مدل برای کاربردهای مختلفی مناسب است. به عنوان مثال، کاربران می‌توانند از این مدل برای تولید ویدیوهای تبلیغاتی، ویدیوهای آموزشی، ویدیوهای سرگرمی، و غیره استفاده کنند. همچنین، این مدل می‌تواند برای تولید محتوای ویدیویی برای شبکه‌های اجتماعی و وب‌سایت‌ها مورد استفاده قرار گیرد. با توجه به ویژگی‌های منحصر به فرد و کارایی بالای این مدل، ای آی کار (AI-KAR) مفتخر است که این مدل را در اختیار کاربران خود قرار دهد. ما امیدواریم که این مدل بتواند به کاربران در تولید محتوای ویدیویی با کیفیت و جذاب کمک کند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	نام مدلی که می‌خواهید استفاده کنید. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
image_url	stringRequired	آدرس اینترنتی تصویر ورودی که می‌خواهید متحرک شود. رزولوشن تصویر باید 720p یا بالاتر باشد.
last_image_url	stringRequired	آدرس اینترنتی مستقیم یا تصویر Base64-encoded که به عنوان فریم آخر ویدیو استفاده می‌شود.
aspect_ratio	string	نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی):
duration	integer	طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی):
resolution	string	کیفیت ویدیوی خروجی. مقدار پیش‌فرض 1080p است. مقادیر مجاز (کلیک برای کپی):
generate_audio	boolean	تعیین می‌کند که آیا برای ویدیو صدا تولید شود یا خیر. مقدار پیش‌فرض true است.
generation_id	stringRequired	شناسه تولید ویدیو

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/video/generations"
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
    }
    data = {
        "model": "google/veo-3.1-first-last-image-to-video-fast",
        "prompt": "A woman looks into the camera, breathes in, then exclaims energetically, 'Hello world!'",
        "image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-1.jpeg",
        "last_image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-2.jpeg",
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 1000
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}