معرفی و مستندات مدل هوش مصنوعی veo-3-1-image-to-video-fast
مستندات مدل تولید ویدیو از تصویر veo-3-1-image-to-video-fast، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی در حد متوسط پشتیبانی میکند. توضیحات فارسی در prompt ممکن است به خوبی در ویدیو منعکس نشوند و نیاز به آزمایش و تنظیم دقیق دارد.
معرفی مدل veo-3-1-image-to-video-fast
مدل veo-3-1-image-to-video-fast یک مدل هوش مصنوعی پیشرفته است که توسط گوگل توسعه یافته و برای تولید ویدیوهای کوتاه و با کیفیت از روی یک تصویر ورودی طراحی شده است. این مدل قادر است ویدیوهایی با رزولوشن 720p و 1080p تولید کند که دارای جزئیات بصری دقیق و صدای هماهنگ هستند. یکی از ویژگیهای برجسته این مدل، پشتیبانی از سبکهای مختلف ویدئویی و حتی تولید دیالوگ است، که آن را به ابزاری قدرتمند برای تولید محتوای خلاقانه تبدیل میکند.
این مدل با دریافت یک تصویر و یک توضیح متنی (prompt) به عنوان ورودی، میتواند یک ویدیوی 8 ثانیهای تولید کند. این ویدیو میتواند شامل حرکات و تغییراتی در تصویر اولیه باشد که با توضیحات متنی ارائه شده هماهنگ است. به عنوان مثال، میتوان از این مدل خواست تا تصویری از یک شخص را به ویدیویی تبدیل کند که در آن شخص در حال انجام یک فعالیت خاص است یا دیالوگی را بیان میکند.
یکی از کاربردهای اصلی این مدل، تولید محتوای تبلیغاتی و آموزشی است. با استفاده از این مدل، میتوان به سرعت و به آسانی ویدیوهای تبلیغاتی جذاب و ویدیوهای آموزشی تعاملی تولید کرد. همچنین، این مدل میتواند در تولید محتوای سرگرمکننده و خلاقانه برای شبکههای اجتماعی و پلتفرمهای ویدیویی مورد استفاده قرار گیرد.
برای استفاده از این مدل، ابتدا باید یک کلید API از ای آی کار (AI-KAR) دریافت کنید. سپس، با استفاده از API ارائه شده، میتوانید درخواست تولید ویدیو را به سرور ارسال کنید. این فرآیند شامل دو مرحله است: ابتدا یک درخواست برای ایجاد و ارسال وظیفه تولید ویدیو به سرور ارسال میشود که یک شناسه تولید (generation ID) را برمیگرداند. سپس، با استفاده از این شناسه، میتوانید ویدیوی تولید شده را از سرور درخواست کنید.
مدل veo-3-1-image-to-video-fast با ارائه امکانات پیشرفته و کیفیت بالای ویدیوهای تولیدی، یک ابزار بسیار ارزشمند برای تولیدکنندگان محتوا، بازاریابان و هر کسی است که به دنبال تولید ویدیوهای جذاب و خلاقانه با استفاده از هوش مصنوعی است. این مدل با سرعت بالا و سهولت استفاده، فرآیند تولید ویدیو را سادهتر و کارآمدتر میکند و به کاربران امکان میدهد تا ایدههای خود را به سرعت به واقعیت تبدیل کنند.
با استفاده از این مدل، میتوانید ویدیوهایی با سبکهای مختلف و با جزئیات بصری و صوتی متنوع تولید کنید. این امکان به شما اجازه میدهد تا محتوای خود را با توجه به نیازها و سلیقههای مخاطبان خود سفارشیسازی کنید و ویدیوهایی تولید کنید که بیشترین تاثیر را داشته باشند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار این پارامتر باید google/veo-3.1-i2v-fast باشد. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیحات متنی صحنه، موضوع یا عملی که میخواهید در ویدیو تولید شود. این متن باید به صورت واضح و دقیق بیان شود. |
image_url | stringRequired | آدرس اینترنتی تصویر ورودی که میخواهید آن را به ویدیو تبدیل کنید. رزولوشن تصویر باید 720p یا بالاتر باشد. |
aspect_ratio | string | نسبت تصویر ویدیوی تولید شده. مقادیر قابل قبول: 16:9 یا 9:16. مقادیر مجاز (کلیک برای کپی): |
duration | integer | طول ویدیوی خروجی به ثانیه. مقدار قابل قبول: 8. مقادیر مجاز (کلیک برای کپی): |
resolution | string | رزولوشن ویدیوی خروجی. مقدار پیشفرض 1080p است. مقادیر قابل قبول: 720p یا 1080p. مقادیر مجاز (کلیک برای کپی): |
generate_audio | boolean | مشخص میکند که آیا برای ویدیو صدا تولید شود یا خیر. مقدار پیشفرض true است. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
AI-KARapi_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/video/generations"
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
}
data = {
"model": "google/veo-3.1-i2v-fast",
"prompt": "The woman puts on glasses with her hands and then sighs and says slowly: 'Well...'.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/video/generations"
params = {
"generation_id": gen_id,
}
headers = {
"Authorization": f"Bearer {AI-KARapi_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 1000
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}