Video Modelskling-ai

معرفی و مستندات مدل هوش مصنوعی avatar-standard

مستندات مدل avatar-standard از kling-ai، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک متن فارسی در سطح قابل قبولی است اما ممکن است در تشخیص ظرایف زبانی و اصطلاحات محاوره‌ای با مشکل مواجه شود.

مدل avatar-standard از kling-ai، که توسط ای آی کار (AI-KAR) ارائه شده است، یک مدل پیشرفته تولید ویدیو است که با استفاده از یک تصویر و یک فایل صوتی، انیمیشن‌های کاراکترهای گویا و هماهنگ با ریتم، آهنگ و معنای گفتار تولید می‌کند. این مدل قادر است ویدیوهایی با کیفیت 720p و نرخ 24 فریم بر ثانیه تولید کند. این مدل با بهره‌گیری از الگوریتم‌های پیچیده یادگیری عمیق، حرکات لب و حالات چهره کاراکتر را به طور دقیق با گفتار هماهنگ می‌کند و تجربه‌ای واقع‌گرایانه و جذاب را برای بیننده فراهم می‌آورد. یکی از ویژگی‌های برجسته این مدل، توانایی آن در تولید انیمیشن‌های طبیعی و پویا است. کاراکترها نه تنها لب‌خوانی دقیقی دارند، بلکه حرکات سر، چشم و بدن آن‌ها نیز به طور هماهنگ با محتوای صوتی تنظیم می‌شود. این امر باعث می‌شود که ویدیوهای تولید شده توسط این مدل، بسیار زنده و باورپذیر به نظر برسند. علاوه بر این، مدل avatar-standard قادر است احساسات و عواطف موجود در صدا را تشخیص داده و آن‌ها را در حالات چهره کاراکتر منعکس کند. به عنوان مثال، اگر صدا حاوی لحن شادی باشد، کاراکتر نیز لبخند خواهد زد و اگر صدا غمگین باشد، حالات چهره کاراکتر نیز متناسب با آن تغییر خواهد کرد. برای استفاده از این مدل، ابتدا باید یک کلید API معتبر از ای آی کار (AI-KAR) دریافت کنید. سپس، با استفاده از API ارائه شده، می‌توانید یک تصویر از کاراکتر و یک فایل صوتی را به مدل ارسال کنید. مدل پس از پردازش، یک ویدیو با کیفیت بالا تولید کرده و لینک دانلود آن را در اختیار شما قرار می‌دهد. این مدل برای کاربردهای مختلفی مانند تولید محتوای آموزشی، تبلیغاتی، سرگرمی و غیره مناسب است. با استفاده از این مدل، می‌توانید به سادگی ویدیوهای جذاب و حرفه‌ای تولید کرده و مخاطبان خود را تحت تاثیر قرار دهید. همچنین، ای آی کار (AI-KAR) به طور مداوم در حال بهبود و توسعه این مدل است تا کیفیت و کارایی آن را افزایش دهد و امکانات جدیدی را به آن اضافه کند. هدف ای آی کار (AI-KAR) ارائه بهترین و پیشرفته‌ترین ابزارهای هوش مصنوعی به کاربران خود است تا آن‌ها بتوانند به راحتی ایده‌های خود را به واقعیت تبدیل کنند. این مدل به شما کمک می کند تا با کمترین هزینه و زمان، ویدیوهای با کیفیت و جذاب تولید کنید و در وقت و هزینه خود صرفه جویی کنید. این مدل برای تولید محتوای ویدیویی در شبکه های اجتماعی، وب سایت ها و سایر پلتفرم های آنلاین بسیار مناسب است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید ویدیو. مقدار ثابت `klingai/avatar-standard` را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
image_url
stringRequired
یک لینک مستقیم به یک تصویر آنلاین یا یک تصویر Base64-encoded که به عنوان پایه بصری یا فریم اول برای ویدیو استفاده می شود.
audio_url
stringRequired
آدرس اینترنتی فایل صوتی که کاراکتر باید آن را اجرا کند.
prompt
string
توضیحات متنی صحنه، موضوع یا عملی که باید در ویدیو تولید شود. حداکثر طول: 2500 کاراکتر.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# replace <YOUR_AI-KARAPI_KEY> with your actual ای آی کار (AI-KAR) key
api_key = "<YOUR_AI-KARAPI_KEY>"
base_url = "https://api.ai-kar.com/v1"

# Creating and sending a video generation task to the server
def generate_video():
    url = f"{base_url}/video/generations"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "klingai/avatar-standard",
        "image_url": "https://cdn.AI-KARapi.com/assets/content/office_man.png",
        "audio_url": "https://storage.googleapis.com/falserverless/example_inputs/omnihuman_audio.mp3",
        # "prompt": "A person speaking playfully, laughing frequently and gesturing wildly."
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = f"{base_url}/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Running video generation and getting a task id
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Trying to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}