Image Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seedream-3.0

مستندات مدل تولید تصویر seedream-3.0 از Bytedance، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه می‌شود.

مدل seedream-3.0 یک مدل تولید تصویر دو زبانه (چینی-انگلیسی) است که توسط Bytedance توسعه داده شده است. این مدل از ابعاد تصویر دلخواه پشتیبانی می‌کند، به شرطی که حاصل ضرب عرض و ارتفاع تصویر از حد مجاز (تا 2K) فراتر نرود. seedream-3.0 زمان پاسخ‌دهی سریع‌تری را ارائه می‌دهد، رندرینگ متن و طرح‌بندی‌های کوچک را بهبود می‌بخشد، زیبایی‌شناسی بصری و انسجام ساختاری قوی‌تری دارد و از دقت بالایی در جزئیات ظریف برخوردار است. این مدل برای تولید تصاویر با کیفیت بالا و جزئیات دقیق، با حفظ انسجام ساختاری و زیبایی‌شناسی بصری طراحی شده است. با استفاده از این مدل، کاربران می‌توانند تصاویری با ابعاد مختلف ایجاد کنند، بدون اینکه نگران محدودیت‌های سخت‌افزاری یا نرم‌افزاری باشند. همچنین، سرعت بالای پردازش این مدل، امکان تولید سریع تصاویر را فراهم می‌کند. این مدل در زمینه‌های مختلفی مانند طراحی گرافیک، تولید محتوای بصری، و توسعه بازی‌های ویدیویی کاربرد دارد. با توجه به پشتیبانی از دو زبان چینی و انگلیسی، این مدل می‌تواند به عنوان یک ابزار قدرتمند برای تولید محتوای بصری چند زبانه مورد استفاده قرار گیرد. مدل seedream-3.0 با ارائه کیفیت بالا، سرعت مناسب و انعطاف‌پذیری در ابعاد تصویر، یک انتخاب عالی برای تولید تصاویر متنوع و با کیفیت است. این مدل با بهره‌گیری از الگوریتم‌های پیشرفته، قادر است تصاویری با جزئیات دقیق و رنگ‌های زنده تولید کند. همچنین، این مدل از قابلیت‌های پیشرفته‌ای برای بهبود رندرینگ متن و طرح‌بندی‌های کوچک برخوردار است، که این امر آن را برای تولید تصاویری با محتوای متنی مناسب می‌سازد. در نهایت، مدل seedream-3.0 با ارائه ترکیبی از کیفیت، سرعت و انعطاف‌پذیری، یک ابزار قدرتمند برای تولید تصاویر با کیفیت بالا در زمینه‌های مختلف است. این مدل توسط ای آی کار (AI-KAR) در دسترس شما قرار گرفته است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت 'bytedance/seedream-3.0' را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند.
aspect_ratio
string
نسبت ابعاد تصویر تولیدی.
مقادیر مجاز (کلیک برای کپی):
seed
integer
با استفاده از یک seed یکسان و یک prompt یکسان، مدل در هر بار یک تصویر یکسان تولید می‌کند.
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به prompt شما پایبند باشد.
response_format
string
فرمت پاسخ تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
size
string
(منسوخ شده) ابعاد تصویر تولید شده (عرض x ارتفاع) بر حسب پیکسل. باید بین [512x512, 2048x2048] باشد.
watermark
boolean
(منسوخ شده) اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "bytedance/seedream-3.0",
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "aspect_ratio": "16:9",
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}