Video Modelsveed

معرفی و مستندات مدل هوش مصنوعی fabric-1.0

مستندات مدل تبدیل تصویر به ویدیو fabric-1.0 از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک متون فارسی در حد قابل قبولی است اما ممکن است در تولید ویدیوهای پیچیده با محتوای فارسی، دقت کمتری داشته باشد.

مدل fabric-1.0 یک مدل تبدیل تصویر به ویدیو است که توسط ای‌آی‌کار (AI-KAR) ارائه شده است. این مدل قادر است هر تصویری را به یک ویدیوی واقع‌گرایانه تبدیل کند که در آن تصویر به نظر می‌رسد در حال صحبت کردن است. این فرایند با استفاده از تکنیک‌های پیشرفته یادگیری عمیق و شبکه‌های عصبی انجام می‌شود که به مدل اجازه می‌دهد تا حرکات لب و صورت را به طور طبیعی و هماهنگ با صدا تولید کند. برای استفاده از این مدل، شما نیاز به یک تصویر و یک فایل صوتی دارید. تصویر می‌تواند یک عکس پرتره یا هر نوع تصویر دیگری باشد که می‌خواهید به ویدیو تبدیل شود. فایل صوتی باید شامل موسیقی و صدای واضح باشد و حداقل ۱۵ ثانیه طول داشته باشد. مدل fabric-1.0 از این ورودی‌ها برای تولید یک ویدیوی جذاب و واقع‌گرایانه استفاده می‌کند. این مدل در زمینه‌های مختلفی کاربرد دارد، از جمله تولید محتوای آموزشی، تبلیغاتی، سرگرمی و حتی ایجاد آواتارهای شخصی. با استفاده از این مدل، می‌توانید به راحتی ویدیوهای سفارشی با کیفیت بالا ایجاد کنید که مخاطبان را جذب کند. یکی از ویژگی‌های برجسته این مدل، توانایی آن در تولید ویدیوهایی با رزولوشن‌های مختلف است. شما می‌توانید ویدیوهایی با رزولوشن 480p یا 720p تولید کنید، که این امکان را به شما می‌دهد تا ویدیوها را برای پلتفرم‌های مختلف بهینه کنید. همچنین، این مدل از API ساده و کاربرپسندی برخوردار است که به شما اجازه می‌دهد تا به راحتی آن را در برنامه‌ها و پروژه‌های خود ادغام کنید. برای شروع کار با مدل fabric-1.0، ابتدا باید یک کلید API از ای‌آی‌کار (AI-KAR) دریافت کنید. سپس می‌توانید با استفاده از API، یک درخواست برای تولید ویدیو ارسال کنید. این درخواست شامل آدرس تصویر، آدرس فایل صوتی و رزولوشن مورد نظر است. پس از ارسال درخواست، مدل یک شناسه تولید (generation ID) را برمی‌گرداند که می‌توانید از آن برای پیگیری وضعیت تولید ویدیو استفاده کنید. پس از تکمیل فرایند تولید، مدل یک URL به شما ارائه می‌دهد که می‌توانید از آن برای دانلود ویدیوی تولید شده استفاده کنید. این فرایند به طور معمول بین ۱ تا ۲ دقیقه طول می‌کشد، اما ممکن است بسته به حجم و پیچیدگی ورودی‌ها، زمان بیشتری نیاز باشد. در نهایت، مدل fabric-1.0 یک ابزار قدرتمند و کارآمد برای تولید ویدیوهای واقع‌گرایانه از تصاویر است که می‌تواند به شما در ایجاد محتوای جذاب و متنوع کمک کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار این پارامتر باید `veed/fabric-1.0` باشد.
مقادیر مجاز (کلیک برای کپی):
image_url
stringRequired
آدرس مستقیم یک تصویر آنلاین یا یک تصویر محلی که به صورت Base64 کدگذاری شده است. این تصویر به عنوان پایه بصری یا اولین فریم برای ویدیو استفاده می‌شود.
audio_url
stringRequired
آدرس فایل صوتی مرجع. این فایل باید شامل موسیقی و صدا باشد و فرمت آن .wav یا .mp3 باشد و طول آن بیشتر از ۱۵ ثانیه باشد.
resolution
stringRequired
رزولوشن ویدیوی تولید شده. گزینه‌های موجود عبارتند از 480p و 720p.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
api_key = "<YOUR_AI-KARAPI_KEY>"

# Creating and sending a video generation task to the server
def generate_video():
    url = "https://api.ai-kar.com/v2/video/generations"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "veed/fabric-1.0",
        "image_url": "https://v3.fal.media/files/koala/NLVPfOI4XL1cWT2PmmqT3_Hope.png",
        "audio_url": "https://v3.fal.media/files/elephant/Oz_g4AwQvXtXpUHL3Pa7u_Hope.mp3",
        "resolution": "720p"
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = "https://api.ai-kar.com/v2/video/generations"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Generate video
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Try to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}