معرفی و مستندات مدل هوش مصنوعی veo-3-fast-image-to-video
مستندات مدل تولید ویدیو از تصویر veo-3-fast-image-to-video از گوگل، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل در درک متون فارسی عملکرد متوسطی دارد. برای دریافت بهترین نتیجه، توصیه میشود توضیحات متنی به زبان انگلیسی ارائه شوند.
معرفی مدل هوش مصنوعی veo-3-fast-image-to-video
مدل veo-3-fast-image-to-video یک مدل پیشرفته تولید ویدیو از تصویر است که توسط گوگل توسعه داده شده است. این مدل قادر است ویدیوهای واقعگرایانه با کیفیت 720p و 1080p با جزئیات بصری و صوتی تولید کند. این مدل به طور خاص برای سرعت و هزینه بهینه شده است و در مقایسه با مدل Veo 3 (Image-to-Video) عملکرد بهتری دارد.
این مدل به شما امکان میدهد تا با ارائه یک تصویر و یک توضیح متنی، ویدیویی با کیفیت بالا تولید کنید. این فرایند شامل دو مرحله اصلی است: ابتدا یک درخواست تولید ویدیو به سرور ارسال میشود و یک شناسه تولید (generation ID) دریافت میکنید. سپس با استفاده از این شناسه، میتوانید وضعیت تولید ویدیو را بررسی کرده و در صورت تکمیل، ویدیوی تولید شده را دریافت کنید.
این مدل میتواند در زمینههای مختلفی مورد استفاده قرار گیرد، از جمله:
- تولید محتوای تبلیغاتی
- ایجاد ویدیوهای آموزشی
- تولید ویدیوهای سرگرمی
- تبدیل تصاویر استاتیک به ویدیوهای پویا
با استفاده از این مدل، میتوانید به راحتی ایدههای خود را به ویدیوهای جذاب و با کیفیت تبدیل کنید. این مدل با بهرهگیری از الگوریتمهای پیشرفته هوش مصنوعی، قادر است ویدیوهایی با جزئیات بالا و حرکات طبیعی تولید کند. همچنین، امکان اضافه کردن صدا به ویدیوها نیز وجود دارد که تجربه کاربری را بهبود میبخشد.
برای استفاده از این مدل، نیاز به یک کلید API دارید. میتوانید از راهنمای شروع سریع ما برای دریافت کلید API استفاده کنید. پس از دریافت کلید API، میتوانید با استفاده از APIهای ارائه شده، درخواستهای تولید ویدیو را ارسال کرده و ویدیوهای تولید شده را دریافت کنید.
این مدل از پارامترهای مختلفی برای کنترل فرایند تولید ویدیو پشتیبانی میکند، از جمله نسبت تصویر، رزولوشن، مدت زمان ویدیو، و توضیحات منفی برای جلوگیری از نمایش عناصر ناخواسته در ویدیو. همچنین، امکان تعیین یک مقدار seed برای تولید نتایج مشابه برای درخواستهای یکسان وجود دارد.
با استفاده از مدل veo-3-fast-image-to-video، میتوانید به راحتی و با سرعت بالا ویدیوهای با کیفیت و واقعگرایانه تولید کنید و ایدههای خود را به واقعیت تبدیل کنید. این مدل یک ابزار قدرتمند برای تولید محتوای ویدیویی است که میتواند در زمینههای مختلفی مورد استفاده قرار گیرد.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار ثابت: google/veo-3.0-i2v-fast مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که میخواهید در ویدیو تولید شود. |
image_url | stringRequired | یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر محلی کدگذاری شده با Base64 که به عنوان پایه بصری یا اولین فریم برای ویدیو استفاده میشود. |
aspect_ratio | string | نسبت تصویر ویدیوی تولید شده. مقادیر مجاز (کلیک برای کپی): |
resolution | string | رزولوشن ویدیوی تولید شده. مقدار پیشفرض: 720P مقادیر مجاز (کلیک برای کپی): |
duration | integer | مدت زمان ویدیوی خروجی به ثانیه. مقادیر مجاز (کلیک برای کپی): |
negative_prompt | string | توضیحات عناصری که باید در ویدیوی تولید شده از آنها اجتناب شود. |
seed | integer | تغییر مقدار seed یک راه برای دریافت نتایج مختلف برای پارامترهای درخواست یکسان است. استفاده از مقدار یکسان برای یک درخواست مشابه نتایج مشابهی تولید میکند. اگر مشخص نشود، یک عدد تصادفی انتخاب میشود. |
enhance_prompt | boolean | اینکه آیا تولید ویدیو بهبود یابد یا خیر. مقدار پیشفرض: true |
generate_audio | boolean | اینکه آیا صدا برای ویدیو تولید شود یا خیر. مقدار پیشفرض: true |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# replace <YOUR_AI-KARAPI_KEY> with your actual ای آی کار (AI-KAR) key
api_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/generate/video/google/generation"
headers = {
"Authorization": f"Bearer {api_key}",
}
data = {
"model": "google/veo-3.0-i2v-fast",
"prompt": "The woman puts on glasses with her hands and then sighs and says slowly: 'Well...'.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
# print(response_data)
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/generate/video/google/generation"
params = {
"generation_id": gen_id,
}
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
headers = {
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
# print("Generation:", response.json())
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 600
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}