Video Modelskling-ai
معرفی و مستندات مدل هوش مصنوعی avatar-standard
مستندات مدل avatar-standard از kling-ai، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک متن فارسی در سطح قابل قبولی است اما ممکن است در تشخیص ظرایف زبانی و اصطلاحات محاورهای با مشکل مواجه شود.
مدل avatar-standard از kling-ai، که توسط ای آی کار (AI-KAR) ارائه شده است، یک مدل پیشرفته تولید ویدیو است که با استفاده از یک تصویر و یک فایل صوتی، انیمیشنهای کاراکترهای گویا و هماهنگ با ریتم، آهنگ و معنای گفتار تولید میکند. این مدل قادر است ویدیوهایی با کیفیت 720p و نرخ 24 فریم بر ثانیه تولید کند. این مدل با بهرهگیری از الگوریتمهای پیچیده یادگیری عمیق، حرکات لب و حالات چهره کاراکتر را به طور دقیق با گفتار هماهنگ میکند و تجربهای واقعگرایانه و جذاب را برای بیننده فراهم میآورد.
یکی از ویژگیهای برجسته این مدل، توانایی آن در تولید انیمیشنهای طبیعی و پویا است. کاراکترها نه تنها لبخوانی دقیقی دارند، بلکه حرکات سر، چشم و بدن آنها نیز به طور هماهنگ با محتوای صوتی تنظیم میشود. این امر باعث میشود که ویدیوهای تولید شده توسط این مدل، بسیار زنده و باورپذیر به نظر برسند. علاوه بر این، مدل avatar-standard قادر است احساسات و عواطف موجود در صدا را تشخیص داده و آنها را در حالات چهره کاراکتر منعکس کند. به عنوان مثال، اگر صدا حاوی لحن شادی باشد، کاراکتر نیز لبخند خواهد زد و اگر صدا غمگین باشد، حالات چهره کاراکتر نیز متناسب با آن تغییر خواهد کرد.
برای استفاده از این مدل، ابتدا باید یک کلید API معتبر از ای آی کار (AI-KAR) دریافت کنید. سپس، با استفاده از API ارائه شده، میتوانید یک تصویر از کاراکتر و یک فایل صوتی را به مدل ارسال کنید. مدل پس از پردازش، یک ویدیو با کیفیت بالا تولید کرده و لینک دانلود آن را در اختیار شما قرار میدهد. این مدل برای کاربردهای مختلفی مانند تولید محتوای آموزشی، تبلیغاتی، سرگرمی و غیره مناسب است. با استفاده از این مدل، میتوانید به سادگی ویدیوهای جذاب و حرفهای تولید کرده و مخاطبان خود را تحت تاثیر قرار دهید. همچنین، ای آی کار (AI-KAR) به طور مداوم در حال بهبود و توسعه این مدل است تا کیفیت و کارایی آن را افزایش دهد و امکانات جدیدی را به آن اضافه کند. هدف ای آی کار (AI-KAR) ارائه بهترین و پیشرفتهترین ابزارهای هوش مصنوعی به کاربران خود است تا آنها بتوانند به راحتی ایدههای خود را به واقعیت تبدیل کنند. این مدل به شما کمک می کند تا با کمترین هزینه و زمان، ویدیوهای با کیفیت و جذاب تولید کنید و در وقت و هزینه خود صرفه جویی کنید. این مدل برای تولید محتوای ویدیویی در شبکه های اجتماعی، وب سایت ها و سایر پلتفرم های آنلاین بسیار مناسب است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید ویدیو. مقدار ثابت `klingai/avatar-standard` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
image_url | stringRequired | یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر Base64-encoded که به عنوان پایه بصری یا فریم اول برای ویدیو استفاده می شود. |
audio_url | stringRequired | آدرس اینترنتی فایل صوتی که کاراکتر باید آن را اجرا کند. |
prompt | string | توضیحات متنی صحنه، موضوع یا عملی که باید در ویدیو تولید شود. حداکثر طول: 2500 کاراکتر. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import time
# replace <YOUR_AI-KARAPI_KEY> with your actual ای آی کار (AI-KAR) key
api_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"
# Creating and sending a video generation task to the server
def generate_video():
url = f"{base_url}/video/generations"
headers = {
"Authorization": f"Bearer {api_key}",
}
data = {
"model": "klingai/avatar-standard",
"image_url": "https://cdn.AI-KARapi.com/assets/content/office_man.png",
"audio_url": "https://storage.googleapis.com/falserverless/example_inputs/omnihuman_audio.mp3",
# "prompt": "A person speaking playfully, laughing frequently and gesturing wildly."
}
response = requests.post(url, json=data, headers=headers)
if response.status_code >= 400:
print(f"Error: {response.status_code} - {response.text}")
else:
response_data = response.json()
print(response_data)
return response_data
# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
url = f"{base_url}/video/generations"
params = {
"generation_id": gen_id,
}
headers = {
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json"
}
response = requests.get(url, params=params, headers=headers)
return response.json()
def main():
# Running video generation and getting a task id
gen_response = generate_video()
gen_id = gen_response.get("id")
print("Generation ID: ", gen_id)
# Trying to retrieve the video from the server every 10 sec
if gen_id:
start_time = time.time()
timeout = 600
while time.time() - start_time < timeout:
response_data = get_video(gen_id)
if response_data is None:
print("Error: No response from API")
break
status = response_data.get("status")
print("Status:", status)
if status == "waiting" or status == "active" or status == "queued" or status == "generating":
print("Still waiting... Checking again in 10 seconds.")
time.sleep(10)
else:
print("Processing complete:/n", response_data)
return response_data
print("Timeout reached. Stopping.")
return None
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
"status": "completed",
"video": {
"url": "#",
"duration": 8
},
"duration": 8,
"error": null,
"meta": {
"usage": {
"tokens_used": 120000
}
}
}