Video Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی veo-3-1-text-to-video
مستندات مدل تولید ویدیو از متن veo-3-1-text-to-video، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، بهتر است از توضیحات انگلیسی استفاده کنید.
مدل veo-3-1-text-to-video یک مدل هوش مصنوعی پیشرفته است که توسط گوگل توسعه یافته و برای تولید ویدیوهای واقعگرایانه از توضیحات متنی طراحی شده است. این مدل قادر است ویدیوهایی با کیفیت بالا و جزئیات دقیق تولید کند که شامل تصاویر بصری و صداهای هماهنگ است. این مدل به کاربران اجازه میدهد تا با ارائه یک متن ساده، ویدیوهایی با طول 4، 6 یا 8 ثانیه و با رزولوشن 720p یا 1080p تولید کنند. یکی از ویژگیهای برجسته این مدل، توانایی آن در درک و تفسیر دقیق دستورات متنی است، که به آن امکان میدهد ویدیوهایی با محتوای متنوع و پیچیده ایجاد کند. کاربران میتوانند با استفاده از پارامترهای مختلف، جنبههای مختلف ویدیو مانند نسبت تصویر، مدت زمان، رزولوشن و حتی عناصر منفی که باید از ویدیو حذف شوند را کنترل کنند. همچنین، این مدل قابلیت تولید صدا برای ویدیوها را نیز دارد که به واقعگرایی و جذابیت ویدیوها میافزاید. از دیگر ویژگیهای مهم این مدل، امکان تعیین یک مقدار seed است که به کاربران اجازه میدهد تا با تغییر این مقدار، نتایج متفاوتی برای یک درخواست مشابه دریافت کنند. این ویژگی برای کاربرانی که به دنبال تنوع و خلاقیت در تولید ویدیوها هستند بسیار مفید است. علاوه بر این، مدل veo-3-1-text-to-video دارای قابلیت auto-fix است که به طور خودکار تلاش میکند تا دستورات متنی را که ممکن است با سیاستهای محتوایی یا بررسیهای اعتبارسنجی مغایرت داشته باشند، بازنویسی کند. این ویژگی به کاربران کمک میکند تا از بروز خطاها و مشکلات احتمالی در فرآیند تولید ویدیو جلوگیری کنند. به طور کلی، مدل veo-3-1-text-to-video یک ابزار قدرتمند و کارآمد برای تولید ویدیوهای واقعگرایانه از توضیحات متنی است که با ارائه امکانات و پارامترهای متنوع، به کاربران اجازه میدهد تا ویدیوهایی با کیفیت بالا و محتوای دلخواه ایجاد کنند. این مدل میتواند در زمینههای مختلفی مانند تولید محتوای آموزشی، تبلیغاتی، هنری و سرگرمی مورد استفاده قرار گیرد و به کاربران کمک کند تا ایدههای خود را به ویدیوهای جذاب و دیدنی تبدیل کنند. این مدل با استفاده از الگوریتمهای پیشرفته و شبکههای عصبی عمیق، قادر است ویدیوهایی با جزئیات دقیق و حرکات طبیعی تولید کند که به واقعیت بسیار نزدیک هستند. همچنین، این مدل به طور مداوم در حال بهبود و توسعه است تا بتواند نیازهای کاربران را به بهترین شکل ممکن برآورده کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار ثابت `google/veo-3.1-t2v` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که میخواهید در ویدیو تولید شود. |
aspect_ratio | string | نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی): |
duration | integer | طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی): |
resolution | string | رزولوشن ویدیوی تولید شده. مقدار پیشفرض `1080p` است. مقادیر مجاز (کلیک برای کپی): |
negative_prompt | string | توضیح عناصری که باید از ویدیوی تولید شده اجتناب شوند. |
enhance_prompt | boolean | مشخص میکند که آیا تولید ویدیو بهبود یابد یا خیر. مقدار پیشفرض `true` است. |
generate_audio | boolean | مشخص میکند که آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیشفرض `true` است. |
seed | integer | تغییر مقدار seed راهی برای به دست آوردن نتایج مختلف برای پارامترهای درخواست یکسان است. استفاده از مقدار یکسان برای یک درخواست مشابه نتایج مشابهی تولید میکند. اگر مشخص نشود، یک عدد تصادفی انتخاب میشود. |
auto_fix | boolean | مشخص میکند که آیا به طور خودکار تلاش شود تا دستورات متنی که با سیاستهای محتوایی یا بررسیهای اعتبارسنجی مغایرت دارند، با بازنویسی آنها اصلاح شوند یا خیر. مقدار پیشفرض `true` است. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/video/generations"
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
}
data = {
"model": "google/veo-3.1-t2v",
"prompt": '''
A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming.
'''
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/video/generations"
params = {
"generation_id": gen_id,
}
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 1000
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}