Video Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی veo-3-1-text-to-video

مستندات مدل تولید ویدیو از متن veo-3-1-text-to-video، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، بهتر است از توضیحات انگلیسی استفاده کنید.

مدل veo-3-1-text-to-video یک مدل هوش مصنوعی پیشرفته است که توسط گوگل توسعه یافته و برای تولید ویدیوهای واقع‌گرایانه از توضیحات متنی طراحی شده است. این مدل قادر است ویدیوهایی با کیفیت بالا و جزئیات دقیق تولید کند که شامل تصاویر بصری و صداهای هماهنگ است. این مدل به کاربران اجازه می‌دهد تا با ارائه یک متن ساده، ویدیوهایی با طول 4، 6 یا 8 ثانیه و با رزولوشن 720p یا 1080p تولید کنند. یکی از ویژگی‌های برجسته این مدل، توانایی آن در درک و تفسیر دقیق دستورات متنی است، که به آن امکان می‌دهد ویدیوهایی با محتوای متنوع و پیچیده ایجاد کند. کاربران می‌توانند با استفاده از پارامترهای مختلف، جنبه‌های مختلف ویدیو مانند نسبت تصویر، مدت زمان، رزولوشن و حتی عناصر منفی که باید از ویدیو حذف شوند را کنترل کنند. همچنین، این مدل قابلیت تولید صدا برای ویدیوها را نیز دارد که به واقع‌گرایی و جذابیت ویدیوها می‌افزاید. از دیگر ویژگی‌های مهم این مدل، امکان تعیین یک مقدار seed است که به کاربران اجازه می‌دهد تا با تغییر این مقدار، نتایج متفاوتی برای یک درخواست مشابه دریافت کنند. این ویژگی برای کاربرانی که به دنبال تنوع و خلاقیت در تولید ویدیوها هستند بسیار مفید است. علاوه بر این، مدل veo-3-1-text-to-video دارای قابلیت auto-fix است که به طور خودکار تلاش می‌کند تا دستورات متنی را که ممکن است با سیاست‌های محتوایی یا بررسی‌های اعتبارسنجی مغایرت داشته باشند، بازنویسی کند. این ویژگی به کاربران کمک می‌کند تا از بروز خطاها و مشکلات احتمالی در فرآیند تولید ویدیو جلوگیری کنند. به طور کلی، مدل veo-3-1-text-to-video یک ابزار قدرتمند و کارآمد برای تولید ویدیوهای واقع‌گرایانه از توضیحات متنی است که با ارائه امکانات و پارامترهای متنوع، به کاربران اجازه می‌دهد تا ویدیوهایی با کیفیت بالا و محتوای دلخواه ایجاد کنند. این مدل می‌تواند در زمینه‌های مختلفی مانند تولید محتوای آموزشی، تبلیغاتی، هنری و سرگرمی مورد استفاده قرار گیرد و به کاربران کمک کند تا ایده‌های خود را به ویدیوهای جذاب و دیدنی تبدیل کنند. این مدل با استفاده از الگوریتم‌های پیشرفته و شبکه‌های عصبی عمیق، قادر است ویدیوهایی با جزئیات دقیق و حرکات طبیعی تولید کند که به واقعیت بسیار نزدیک هستند. همچنین، این مدل به طور مداوم در حال بهبود و توسعه است تا بتواند نیازهای کاربران را به بهترین شکل ممکن برآورده کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار ثابت `google/veo-3.1-t2v` را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده.
مقادیر مجاز (کلیک برای کپی):
duration
integer
طول ویدیوی خروجی بر حسب ثانیه.
مقادیر مجاز (کلیک برای کپی):
resolution
string
رزولوشن ویدیوی تولید شده. مقدار پیش‌فرض `1080p` است.
مقادیر مجاز (کلیک برای کپی):
negative_prompt
string
توضیح عناصری که باید از ویدیوی تولید شده اجتناب شوند.
enhance_prompt
boolean
مشخص می‌کند که آیا تولید ویدیو بهبود یابد یا خیر. مقدار پیش‌فرض `true` است.
generate_audio
boolean
مشخص می‌کند که آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیش‌فرض `true` است.
seed
integer
تغییر مقدار seed راهی برای به دست آوردن نتایج مختلف برای پارامترهای درخواست یکسان است. استفاده از مقدار یکسان برای یک درخواست مشابه نتایج مشابهی تولید می‌کند. اگر مشخص نشود، یک عدد تصادفی انتخاب می‌شود.
auto_fix
boolean
مشخص می‌کند که آیا به طور خودکار تلاش شود تا دستورات متنی که با سیاست‌های محتوایی یا بررسی‌های اعتبارسنجی مغایرت دارند، با بازنویسی آن‌ها اصلاح شوند یا خیر. مقدار پیش‌فرض `true` است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/video/generations"
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
    }
    data = {
        "model": "google/veo-3.1-t2v",
        "prompt": '''
A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming.
'''
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {AI-KARapi_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 1000
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}