Image Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seedream-v4-edit-image-to-image

مستندات مدل seedream-v4-edit-image-to-image ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند. برای بهترین نتیجه، از prompt های انگلیسی استفاده کنید.

مدل seedream-v4-edit-image-to-image یک مدل پیشرفته ویرایش تصویر است که توسط bytedance توسعه داده شده و اکنون در دسترس کاربران ای آی کار (AI-KAR) قرار دارد. این مدل امکانات متنوعی را برای ویرایش تصاویر فراهم می‌کند، از جمله جایگزینی پس‌زمینه، ویرایش اشیاء موجود در تصویر، تنظیم استایل و رنگ، بهبود نورپردازی و بافت، و اعمال فیلترهای هنری. یکی از ویژگی‌های برجسته این مدل، حفظ سازگاری کاراکترها در طول فرآیند ویرایش است، به این معنی که اگر تصویری شامل چهره یا شخصیت خاصی باشد، مدل تلاش می‌کند تا در حین اعمال تغییرات، ویژگی‌های اصلی آن را حفظ کند.

این مدل به کاربران اجازه می‌دهد تا به صورت تکراری و مرحله به مرحله تصاویر خود را ویرایش کنند، به این ترتیب که می‌توانند تغییرات کوچکی را اعمال کرده و نتیجه را مشاهده کنند، و سپس تغییرات بعدی را بر اساس نتیجه قبلی اعمال کنند. این قابلیت به ویژه برای پروژه‌هایی که نیاز به دقت و کنترل بالا دارند، بسیار مفید است.

یکی دیگر از کاربردهای مهم این مدل، امکان ترکیب تصاویر مختلف با یکدیگر است. به عنوان مثال، می‌توان دو تصویر جداگانه را به گونه‌ای با هم ترکیب کرد که یک شیء از یک تصویر در تصویر دیگر قرار گیرد، یا پس‌زمینه یک تصویر با پس‌زمینه تصویر دیگر جایگزین شود. این قابلیت می‌تواند برای ایجاد تصاویر خلاقانه و منحصر به فرد بسیار کارآمد باشد.

علاوه بر این، مدل seedream-v4-edit-image-to-image از طریق API قابل دسترسی است، که این امکان را به توسعه‌دهندگان می‌دهد تا آن را در برنامه‌ها و پروژه‌های خود ادغام کنند. این API به کاربران اجازه می‌دهد تا تصاویر خود را به صورت برنامه‌نویسی ویرایش کرده و نتایج را به صورت خودکار دریافت کنند. این ویژگی به ویژه برای پروژه‌هایی که نیاز به پردازش دسته‌ای تصاویر دارند، بسیار ارزشمند است.

در مجموع، مدل seedream-v4-edit-image-to-image یک ابزار قدرتمند و انعطاف‌پذیر برای ویرایش تصاویر است که می‌تواند در زمینه‌های مختلفی از جمله طراحی گرافیک، تولید محتوا، و توسعه نرم‌افزار مورد استفاده قرار گیرد. با استفاده از این مدل، کاربران می‌توانند به راحتی تصاویر خود را بهبود بخشیده و خلاقیت خود را به واقعیت تبدیل کنند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار ثابت: bytedance/seedream-v4-edit
مقادیر مجاز (کلیک برای کپی):
image_urls
stringRequired
لیستی از URL ها یا تصاویر Base64 رمزگذاری شده محلی برای ویرایش. حداقل 1 و حداکثر 10 URL.
image_size
string
اندازه تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
seed
integer
مقدار seed برای تولید تصاویر تکرارپذیر. با seed یکسان و prompt یکسان، تصویر یکسانی تولید می‌شود.
sync_mode
boolean
اگر true باشد، تابع منتظر می‌ماند تا تصویر تولید و بارگذاری شود و سپس پاسخ را برمی‌گرداند. این کار باعث افزایش تاخیر می‌شود اما به شما امکان می‌دهد تصویر را مستقیماً در پاسخ بدون نیاز به CDN دریافت کنید.
enable_safety_checker
boolean
اگر True باشد، بررسی کننده ایمنی فعال می‌شود.
prompt
stringRequired
متن prompt که محتوا، سبک یا ترکیب تصویر را توصیف می‌کند. حداکثر 4000 کاراکتر.
num_images
number
تعداد تصاویری که باید تولید شوند. حداقل 1 و حداکثر 4.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

response = requests.post(
    "https://api.ai-kar.com/v1/images/generations",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type": "application/json",
    },
    json={
        "model": "bytedance/seedream-v4-edit",
        "prompt": "Add a bird to the foreground of the photo.",
        "image_urls": [
            "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png"
        ]
    }
)

data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}