Video Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی veo-3-1-first-last-image-to-video-fast
مستندات مدل تولید ویدیو از روی دو تصویر با هوش مصنوعی veo-3-1-first-last-image-to-video-fast، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک دستورات فارسی ممکن است نیازمند کمی ویرایش و سادهسازی باشد تا بهترین نتیجه حاصل شود.
مدل هوش مصنوعی veo-3-1-first-last-image-to-video-fast، یک مدل پیشرفته تولید ویدیو است که توسط گوگل توسعه یافته و اکنون از طریق ای آی کار (AI-KAR) در دسترس است. این مدل قادر است ویدیوهای واقعگرایانه با کیفیت 720p و 1080p با جزئیات بصری و صوتی تولید کند. این مدل از دو تصویر، یکی به عنوان فریم اول و دیگری به عنوان فریم آخر، و یک توضیح متنی (prompt) برای تولید ویدیو استفاده میکند. این قابلیت به کاربران اجازه میدهد تا با کمترین تلاش، ویدیوهایی با سبکهای مختلف و حتی با پشتیبانی از دیالوگ ایجاد کنند.
یکی از ویژگیهای برجسته این مدل، سرعت بالای آن در تولید ویدیو است. با استفاده از الگوریتمهای بهینهسازی شده، این مدل میتواند در کمترین زمان ممکن ویدیوهای با کیفیت بالا تولید کند. این ویژگی برای کاربرانی که نیاز به تولید سریع ویدیو دارند، بسیار حائز اهمیت است.
مدل veo-3-1-first-last-image-to-video-fast از طریق API قابل دسترسی است و کاربران میتوانند با ارسال درخواستهای HTTP، ویدیوهای مورد نظر خود را تولید کنند. API این مدل به گونهای طراحی شده است که استفاده از آن بسیار آسان و کاربرپسند باشد. کاربران میتوانند با استفاده از پارامترهای مختلف، ویژگیهای ویدیو تولید شده را کنترل کنند.
این مدل از پارامترهای مختلفی برای کنترل ویژگیهای ویدیو پشتیبانی میکند. به عنوان مثال، کاربران میتوانند نسبت تصویر (aspect ratio)، مدت زمان ویدیو (duration)، و کیفیت تصویر (resolution) را تعیین کنند. همچنین، این مدل قابلیت تولید صدا برای ویدیو را نیز دارد. کاربران میتوانند با فعال کردن گزینه generate_audio، صدای مناسبی برای ویدیوی خود تولید کنند.
برای استفاده از این مدل، کاربران باید ابتدا یک کلید API از ای آی کار (AI-KAR) دریافت کنند. پس از دریافت کلید API، کاربران میتوانند با استفاده از API، درخواستهای تولید ویدیو را ارسال کنند. فرآیند تولید ویدیو شامل دو مرحله است: ابتدا یک درخواست برای ایجاد یک وظیفه تولید ویدیو به سرور ارسال میشود و یک شناسه تولید (generation ID) دریافت میشود. سپس، با استفاده از این شناسه، کاربران میتوانند وضعیت وظیفه تولید ویدیو را بررسی کنند و پس از تکمیل، ویدیوی تولید شده را دریافت کنند.
این مدل برای کاربردهای مختلفی مناسب است. به عنوان مثال، کاربران میتوانند از این مدل برای تولید ویدیوهای تبلیغاتی، ویدیوهای آموزشی، ویدیوهای سرگرمی، و غیره استفاده کنند. همچنین، این مدل میتواند برای تولید محتوای ویدیویی برای شبکههای اجتماعی و وبسایتها مورد استفاده قرار گیرد.
با توجه به ویژگیهای منحصر به فرد و کارایی بالای این مدل، ای آی کار (AI-KAR) مفتخر است که این مدل را در اختیار کاربران خود قرار دهد. ما امیدواریم که این مدل بتواند به کاربران در تولید محتوای ویدیویی با کیفیت و جذاب کمک کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدلی که میخواهید استفاده کنید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که میخواهید در ویدیو تولید شود. |
image_url | stringRequired | آدرس اینترنتی تصویر ورودی که میخواهید متحرک شود. رزولوشن تصویر باید 720p یا بالاتر باشد. |
last_image_url | stringRequired | آدرس اینترنتی مستقیم یا تصویر Base64-encoded که به عنوان فریم آخر ویدیو استفاده میشود. |
aspect_ratio | string | نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی): |
duration | integer | طول ویدیوی خروجی بر حسب ثانیه. مقادیر مجاز (کلیک برای کپی): |
resolution | string | کیفیت ویدیوی خروجی. مقدار پیشفرض 1080p است. مقادیر مجاز (کلیک برای کپی): |
generate_audio | boolean | تعیین میکند که آیا برای ویدیو صدا تولید شود یا خیر. مقدار پیشفرض true است. |
generation_id | stringRequired | شناسه تولید ویدیو |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/video/generations"
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
}
data = {
"model": "google/veo-3.1-first-last-image-to-video-fast",
"prompt": "A woman looks into the camera, breathes in, then exclaims energetically, 'Hello world!'",
"image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-1.jpeg",
"last_image_url": "https://storage.googleapis.com/falserverless/example_inputs/veo31-flf2v-input-2.jpeg",
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/video/generations"
params = {
"generation_id": gen_id,
}
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 1000
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}