Video Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seedance-1.0-pro-text-to-video

مستندات مدل تولید ویدیو از متن seedance-1.0-pro-text-to-video، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از متون انگلیسی استفاده کنید، اما استفاده از متون فارسی نیز می‌تواند نتایج قابل قبولی ارائه دهد.

معرفی مدل seedance-1.0-pro-text-to-video

مدل seedance-1.0-pro-text-to-video یک مدل هوش مصنوعی پیشرفته است که توسط bytedance توسعه داده شده و در پلتفرم ای آی کار (AI-KAR) ارائه می‌شود. این مدل قادر است تا از توضیحات متنی (prompt) ویدیوهای حرفه‌ای با کیفیت 720p تولید کند. یکی از ویژگی‌های برجسته این مدل، امکان ثابت نگه داشتن دوربین در طول ویدیو است که به ایجاد ویدیوهای سینمایی و جذاب کمک می‌کند.

قابلیت‌های کلیدی

  • تولید ویدیو از متن: این مدل با دریافت یک متن توصیفی، ویدیویی با محتوای مرتبط تولید می‌کند.
  • کیفیت 720p: ویدیوهای تولید شده دارای کیفیت HD (720p) هستند که برای استفاده در شبکه‌های اجتماعی و وب‌سایت‌ها مناسب است.
  • کنترل دوربین: امکان ثابت نگه داشتن دوربین در طول ویدیو وجود دارد که به ایجاد ویدیوهای حرفه‌ای‌تر کمک می‌کند.
  • تنظیمات پیشرفته: امکان تنظیم نسبت تصویر (aspect ratio) و طول ویدیو (duration) وجود دارد.
  • تولید سریع: ویدیوها در مدت زمان کوتاهی (حدود یک دقیقه) تولید می‌شوند.

کاربردهای مدل

مدل seedance-1.0-pro-text-to-video کاربردهای گسترده‌ای در زمینه‌های مختلف دارد، از جمله:

  • تولید محتوای تبلیغاتی: کسب‌وکارها می‌توانند از این مدل برای تولید ویدیوهای تبلیغاتی جذاب و خلاقانه استفاده کنند.
  • تولید محتوای آموزشی: معلمان و مربیان می‌توانند از این مدل برای تولید ویدیوهای آموزشی جذاب و تعاملی استفاده کنند.
  • تولید محتوای سرگرمی: تولیدکنندگان محتوا می‌توانند از این مدل برای تولید ویدیوهای سرگرم‌کننده و خلاقانه استفاده کنند.
  • تولید پیش‌نمایش فیلم و سریال: با استفاده از متن فیلمنامه، می‌توان پیش‌نمایش‌های جذاب ویدیویی تولید کرد.
  • تولید ویدیوهای هنری: هنرمندان می‌توانند از این مدل برای تولید ویدیوهای هنری و تجربی استفاده کنند.

نحوه استفاده

برای استفاده از این مدل، ابتدا باید یک حساب کاربری در پلتفرم ای آی کار (AI-KAR) ایجاد کنید و کلید API خود را دریافت کنید. سپس می‌توانید از طریق API این مدل، درخواست تولید ویدیو را ارسال کنید. در درخواست خود، باید متن توصیفی (prompt) و سایر تنظیمات مورد نظر را مشخص کنید. پس از ارسال درخواست، مدل ویدیو را تولید کرده و URL آن را در اختیار شما قرار می‌دهد.

نکات مهم

  • کیفیت متن توصیفی: کیفیت و دقت متن توصیفی (prompt) تاثیر زیادی بر کیفیت و محتوای ویدیوی تولید شده دارد. سعی کنید متن خود را به صورت واضح و دقیق بنویسید.
  • تنظیمات مدل: با تغییر تنظیمات مدل (مانند نسبت تصویر و طول ویدیو)، می‌توانید ویدیوهای متنوعی تولید کنید.
  • استفاده از seed: با استفاده از پارامتر seed، می‌توانید نتایج متفاوتی برای یک متن توصیفی یکسان بدست آورید.

مدل seedance-1.0-pro-text-to-video یک ابزار قدرتمند و کارآمد برای تولید ویدیو از متن است که می‌تواند به شما در تولید محتوای ویدیویی جذاب و حرفه‌ای کمک کند. این مدل در پلتفرم ای آی کار (AI-KAR) با رابط کاربری آسان و API قدرتمند در دسترس است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار این پارامتر باید 'bytedance/seedance-1-0-pro-t2v' باشد.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیحات متنی صحنه، موضوع یا عملی که می‌خواهید در ویدیو تولید شود.
resolution
string
یک شمارش که در آن ضلع کوتاه فریم ویدیو، وضوح را تعیین می‌کند. مقدار پیش‌فرض 720p است.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت تصویر ویدیوی تولید شده. مقدار پیش‌فرض 16:9 است.
مقادیر مجاز (کلیک برای کپی):
duration
integer
طول ویدیوی خروجی به ثانیه.
مقادیر مجاز (کلیک برای کپی):
seed
integer
تغییر عدد seed راهی برای به دست آوردن نتایج مختلف برای سایر پارامترهای درخواست یکسان است. استفاده از مقدار یکسان برای یک درخواست مشابه، نتایج مشابهی تولید می‌کند. اگر مشخص نشود، یک عدد تصادفی انتخاب می‌شود.
camera_fixed
boolean
تعیین می‌کند که آیا موقعیت دوربین ثابت باشد یا خیر. true: موقعیت دوربین را ثابت کنید. پلتفرم دستورالعمل‌هایی را برای ثابت کردن موقعیت دوربین در اعلان کاربر اضافه می‌کند، اما اثر واقعی تضمین نمی‌شود. false: موقعیت دوربین را ثابت نکنید. مقدار پیش‌فرض false است.
watermark
boolean
منسوخ شده: تعیین می‌کند که آیا ویدیو حاوی واترمارک باشد یا خیر. مقدار پیش‌فرض false است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import time

# Insert your ای آی کار (AI-KAR) key instead of <YOUR_AI-KARAPI_KEY>:
api_key = "<YOUR_AI-KARAPI_KEY>"

# Creating and sending a video generation task to the server
def generate_video():
    url = "https://api.ai-kar.com/v1/v2/generate/video/bytedance/generation"
    headers = {
        "Authorization": f"Bearer {api_key}",
    }
    data = {
        "model": "bytedance/seedance-1-0-pro-t2v",
        "prompt": "A menacing evil dragon appears in a distance above the tallest mountain, then rushes toward the camera with its jaws open, revealing massive fangs. We see it's coming",
    }
    response = requests.post(url, json=data, headers=headers)
    if response.status_code >= 400:
        print(f"Error: {response.status_code} - {response.text}")
    else:
        response_data = response.json()
        print(response_data)
        return response_data

# Requesting the result of the task from the server using the generation_id
def get_video(gen_id):
    url = "https://api.ai-kar.com/v1/v2/generate/video/bytedance/generation"
    params = {
        "generation_id": gen_id,
    }
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    response = requests.get(url, params=params, headers=headers)
    return response.json()

def main():
    # Generate video
    gen_response = generate_video()
    gen_id = gen_response.get("id")
    print("Generation ID:  ", gen_id)

    # Try to retrieve the video from the server every 10 sec
    if gen_id:
        start_time = time.time()
        timeout = 600
        while time.time() - start_time < timeout:
            response_data = get_video(gen_id)
            if response_data is None:
                print("Error: No response from API")
                break
            status = response_data.get("status")
            print("Status:", status)
            if status == "waiting" or status == "active" or  status == "queued" or status == "generating":
                print("Still waiting... Checking again in 10 seconds.")
                time.sleep(10)
            else:
                print("Processing complete:/n", response_data)
                return response_data
        print("Timeout reached. Stopping.")
        return None

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "60ac7c34-3224-4b14-8e7d-0aa0db708325",
  "status": "completed",
  "video": {
    "url": "#",
    "duration": 8
  },
  "duration": 8,
  "error": null,
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}