Image Modelsbytedance
معرفی و مستندات مدل هوش مصنوعی seedream-v4-edit-image-to-image
مستندات مدل seedream-v4-edit-image-to-image ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت ضعیف پشتیبانی میکند. برای بهترین نتیجه، از prompt های انگلیسی استفاده کنید.
مدل seedream-v4-edit-image-to-image یک مدل پیشرفته ویرایش تصویر است که توسط bytedance توسعه داده شده و اکنون در دسترس کاربران ای آی کار (AI-KAR) قرار دارد. این مدل امکانات متنوعی را برای ویرایش تصاویر فراهم میکند، از جمله جایگزینی پسزمینه، ویرایش اشیاء موجود در تصویر، تنظیم استایل و رنگ، بهبود نورپردازی و بافت، و اعمال فیلترهای هنری. یکی از ویژگیهای برجسته این مدل، حفظ سازگاری کاراکترها در طول فرآیند ویرایش است، به این معنی که اگر تصویری شامل چهره یا شخصیت خاصی باشد، مدل تلاش میکند تا در حین اعمال تغییرات، ویژگیهای اصلی آن را حفظ کند.
این مدل به کاربران اجازه میدهد تا به صورت تکراری و مرحله به مرحله تصاویر خود را ویرایش کنند، به این ترتیب که میتوانند تغییرات کوچکی را اعمال کرده و نتیجه را مشاهده کنند، و سپس تغییرات بعدی را بر اساس نتیجه قبلی اعمال کنند. این قابلیت به ویژه برای پروژههایی که نیاز به دقت و کنترل بالا دارند، بسیار مفید است.
یکی دیگر از کاربردهای مهم این مدل، امکان ترکیب تصاویر مختلف با یکدیگر است. به عنوان مثال، میتوان دو تصویر جداگانه را به گونهای با هم ترکیب کرد که یک شیء از یک تصویر در تصویر دیگر قرار گیرد، یا پسزمینه یک تصویر با پسزمینه تصویر دیگر جایگزین شود. این قابلیت میتواند برای ایجاد تصاویر خلاقانه و منحصر به فرد بسیار کارآمد باشد.
علاوه بر این، مدل seedream-v4-edit-image-to-image از طریق API قابل دسترسی است، که این امکان را به توسعهدهندگان میدهد تا آن را در برنامهها و پروژههای خود ادغام کنند. این API به کاربران اجازه میدهد تا تصاویر خود را به صورت برنامهنویسی ویرایش کرده و نتایج را به صورت خودکار دریافت کنند. این ویژگی به ویژه برای پروژههایی که نیاز به پردازش دستهای تصاویر دارند، بسیار ارزشمند است.
در مجموع، مدل seedream-v4-edit-image-to-image یک ابزار قدرتمند و انعطافپذیر برای ویرایش تصاویر است که میتواند در زمینههای مختلفی از جمله طراحی گرافیک، تولید محتوا، و توسعه نرمافزار مورد استفاده قرار گیرد. با استفاده از این مدل، کاربران میتوانند به راحتی تصاویر خود را بهبود بخشیده و خلاقیت خود را به واقعیت تبدیل کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. مقدار ثابت: bytedance/seedream-v4-edit مقادیر مجاز (کلیک برای کپی): |
image_urls | stringRequired | لیستی از URL ها یا تصاویر Base64 رمزگذاری شده محلی برای ویرایش. حداقل 1 و حداکثر 10 URL. |
image_size | string | اندازه تصویر تولید شده. مقادیر مجاز (کلیک برای کپی): |
seed | integer | مقدار seed برای تولید تصاویر تکرارپذیر. با seed یکسان و prompt یکسان، تصویر یکسانی تولید میشود. |
sync_mode | boolean | اگر true باشد، تابع منتظر میماند تا تصویر تولید و بارگذاری شود و سپس پاسخ را برمیگرداند. این کار باعث افزایش تاخیر میشود اما به شما امکان میدهد تصویر را مستقیماً در پاسخ بدون نیاز به CDN دریافت کنید. |
enable_safety_checker | boolean | اگر True باشد، بررسی کننده ایمنی فعال میشود. |
prompt | stringRequired | متن prompt که محتوا، سبک یا ترکیب تصویر را توصیف میکند. حداکثر 4000 کاراکتر. |
num_images | number | تعداد تصاویری که باید تولید شوند. حداقل 1 و حداکثر 4. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "bytedance/seedream-v4-edit",
"prompt": "Add a bird to the foreground of the photo.",
"image_urls": [
"https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png"
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}