Image Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seedream-3.0

مستندات مدل تولید تصویر seedream-3.0 از Bytedance، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه می‌شود.

مدل seedream-3.0 یک مدل تولید تصویر دو زبانه (چینی-انگلیسی) است که توسط Bytedance توسعه داده شده است. این مدل از ابعاد تصویر دلخواه پشتیبانی می‌کند، به شرطی که حاصل ضرب عرض و ارتفاع تصویر از حد مجاز (تا 2K) فراتر نرود. seedream-3.0 زمان پاسخ‌دهی سریع‌تری را ارائه می‌دهد، رندرینگ متن و طرح‌بندی‌های کوچک را بهبود می‌بخشد، زیبایی‌شناسی بصری و انسجام ساختاری قوی‌تری دارد و از دقت بالایی در جزئیات ظریف برخوردار است. این مدل برای تولید تصاویر با کیفیت بالا و جزئیات دقیق، با حفظ انسجام ساختاری و زیبایی‌شناسی بصری طراحی شده است. با استفاده از این مدل، کاربران می‌توانند تصاویری با ابعاد مختلف ایجاد کنند، بدون اینکه نگران محدودیت‌های سخت‌افزاری یا نرم‌افزاری باشند. همچنین، سرعت بالای پردازش این مدل، امکان تولید سریع تصاویر را فراهم می‌کند. این مدل در زمینه‌های مختلفی مانند طراحی گرافیک، تولید محتوای بصری، و توسعه بازی‌های ویدیویی کاربرد دارد. با توجه به پشتیبانی از دو زبان چینی و انگلیسی، این مدل می‌تواند به عنوان یک ابزار قدرتمند برای تولید محتوای بصری چند زبانه مورد استفاده قرار گیرد. مدل seedream-3.0 با ارائه کیفیت بالا، سرعت مناسب و انعطاف‌پذیری در ابعاد تصویر، یک انتخاب عالی برای تولید تصاویر متنوع و با کیفیت است. این مدل با بهره‌گیری از الگوریتم‌های پیشرفته، قادر است تصاویری با جزئیات دقیق و رنگ‌های زنده تولید کند. همچنین، این مدل از قابلیت‌های پیشرفته‌ای برای بهبود رندرینگ متن و طرح‌بندی‌های کوچک برخوردار است، که این امر آن را برای تولید تصاویری با محتوای متنی مناسب می‌سازد. در نهایت، مدل seedream-3.0 با ارائه ترکیبی از کیفیت، سرعت و انعطاف‌پذیری، یک ابزار قدرتمند برای تولید تصاویر با کیفیت بالا در زمینه‌های مختلف است. این مدل توسط ای آی کار (AI-KAR) در دسترس شما قرار گرفته است.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت 'bytedance/seedream-3.0' را بپذیرید. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند.
aspect_ratio	string	نسبت ابعاد تصویر تولیدی. مقادیر مجاز (کلیک برای کپی):
seed	integer	با استفاده از یک seed یکسان و یک prompt یکسان، مدل در هر بار یک تصویر یکسان تولید می‌کند.
guidance_scale	number	مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به prompt شما پایبند باشد.
response_format	string	فرمت پاسخ تصویر تولید شده. مقادیر مجاز (کلیک برای کپی):
size	string	(منسوخ شده) ابعاد تصویر تولید شده (عرض x ارتفاع) بر حسب پیکسل. باید بین [512x512, 2048x2048] باشد.
watermark	boolean	(منسوخ شده) اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "bytedance/seedream-3.0",
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "aspect_ratio": "16:9",
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}