Image Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seedream-v4-text-to-image

مستندات مدل تولید تصویر از متن seedream-v4-text-to-image، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه می‌شود.

مدل seedream-v4-text-to-image یک مدل هوش مصنوعی پیشرفته برای تولید تصاویر از متن است که توسط bytedance توسعه داده شده است. این مدل با سرعت بالا و دقت فراوان، تصاویری با کیفیت و مطابق با توضیحات متنی ارائه می‌دهد. یکی از ویژگی‌های برجسته این مدل، ثبات در رندر شخصیت‌ها است، به این معنی که اگر یک شخصیت خاص را در چندین تصویر مختلف درخواست کنید، مدل قادر است آن شخصیت را به طور consistent و با حفظ ویژگی‌های ظاهری در تمام تصاویر تولید کند. کیفیت تصاویر تولید شده توسط این مدل با Gemini 2.5 Flash Image (Nano Banana) قابل مقایسه است. این مدل برای کاربردهای مختلفی از جمله تولید محتوای بصری برای شبکه‌های اجتماعی، طراحی گرافیکی، تولید تصاویر هنری و غیره مناسب است. با استفاده از این مدل، کاربران می‌توانند به سادگی و با وارد کردن یک متن توصیفی، تصاویر دلخواه خود را ایجاد کنند. این مدل از طریق API قابل دسترسی است و کاربران می‌توانند با استفاده از کلید API خود، از امکانات آن بهره‌مند شوند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در این مدل وجود دارد، از جمله اندازه تصویر، seed برای تولید تصاویر تکرارپذیر، فعال یا غیرفعال کردن safety checker، و تعداد تصاویر تولیدی. این مدل با بهره‌گیری از الگوریتم‌های پیشرفته یادگیری عمیق، قادر است تصاویر با جزئیات بالا و رنگ‌های زنده تولید کند. همچنین، این مدل از نظر مصرف منابع نیز بهینه شده است و با سرعت بالا تصاویر را تولید می‌کند. در مجموع، مدل seedream-v4-text-to-image یک ابزار قدرتمند و کارآمد برای تولید تصاویر از متن است که می‌تواند نیازهای مختلف کاربران را در زمینه تولید محتوای بصری برآورده کند. تیم ای آی کار (AI-KAR) این مدل را به عنوان یکی از بهترین گزینه‌ها در زمینه تولید تصویر از متن پیشنهاد می‌کند. این مدل به دلیل سرعت بالا، کیفیت تصاویر تولیدی و ثبات در رندر شخصیت‌ها، یک انتخاب عالی برای کاربران حرفه‌ای و غیرحرفه‌ای است.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدلی که برای تولید تصویر استفاده می‌شود. مقادیر مجاز (کلیک برای کپی):
image_size	string \| object	اندازه تصویر تولید شده. مقادیر مجاز (کلیک برای کپی):
seed	integer	مقدار seed برای تولید تصاویر تکرارپذیر. با استفاده از یک seed مشخص و یک prompt یکسان، همیشه یک تصویر یکسان تولید می‌شود.
sync_mode	boolean	اگر روی true تنظیم شود، تابع منتظر می‌ماند تا تصویر تولید و آپلود شود و سپس پاسخ را برمی‌گرداند. این کار باعث افزایش تاخیر می‌شود، اما به شما امکان می‌دهد تصویر را مستقیماً در پاسخ بدون نیاز به CDN دریافت کنید.
enable_safety_checker	boolean	اگر روی True تنظیم شود، safety checker فعال می‌شود.
prompt	stringRequired	متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص می‌کند.
num_images	number	تعداد تصاویری که باید تولید شوند.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "bytedance/seedream-v4-text-to-image",
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "image_size": {
                "width": 4096,
                "height": 4096
            },
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}