معرفی و مستندات مدل هوش مصنوعی seededit-3.0-image-to-image
مستندات مدل seededit-3.0-image-to-image ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت ضعیف پشتیبانی میکند. برای دریافت بهترین نتیجه، استفاده از توضیحات (prompt) انگلیسی توصیه میشود.
معرفی مدل seededit-3.0-image-to-image
مدل seededit-3.0-image-to-image یک مدل پیشرفته تولید تصویر است که توسط bytedance توسعه داده شده است. این مدل با هدف ویرایش تصاویر موجود با دقت و کیفیت بالا طراحی شده است. یکی از ویژگیهای برجسته این مدل، توانایی پردازش و تولید تصاویر با رزولوشن 4K است که امکان ایجاد تغییرات دقیق و طبیعی را فراهم میکند. این مدل به طور خاص برای ویرایش مناطق انتخاب شده در تصاویر طراحی شده است، به طوری که تغییرات اعمال شده به صورت طبیعی و یکپارچه با سایر بخشهای تصویر ترکیب میشوند. این امر باعث میشود تا خروجی نهایی، تصویری با کیفیت و بدون نقص باشد.
یکی از مزایای کلیدی این مدل، حفظ وفاداری بصری مناطق غیر ویرایش شده است. به این معنا که هنگام اعمال تغییرات در یک بخش خاص از تصویر، سایر بخشها بدون تغییر باقی میمانند و کیفیت اصلی خود را حفظ میکنند. این ویژگی برای کاربرانی که نیاز به ویرایش دقیق و جزئی تصاویر دارند، بسیار حائز اهمیت است. مدل seededit-3.0-image-to-image قادر است تا با دریافت یک تصویر و یک توضیح متنی (prompt)، تغییرات مورد نظر را در تصویر اعمال کند. این توضیحات میتوانند شامل تغییر در محتوا، سبک یا ترکیببندی تصویر باشند.
به عنوان مثال، کاربر میتواند با ارائه یک تصویر از یک منظره طبیعی و یک توضیح متنی مانند "اضافه کردن یک آبشار به تصویر"، مدل را وادار به ایجاد یک آبشار در تصویر کند. مدل با تحلیل تصویر و درک توضیح متنی، به طور خودکار آبشار را به تصویر اضافه میکند، به طوری که با سایر عناصر تصویر هماهنگ باشد و به نظر طبیعی برسد. این مدل در زمینههای مختلفی کاربرد دارد. از جمله این کاربردها میتوان به ویرایش عکسهای شخصی، ایجاد تصاویر تبلیغاتی، طراحی گرافیکی و تولید محتوای بصری برای شبکههای اجتماعی اشاره کرد. با استفاده از این مدل، کاربران میتوانند به راحتی و با سرعت بالا، تصاویر خود را ویرایش کرده و به نتایج دلخواه دست یابند.
برای استفاده از مدل seededit-3.0-image-to-image، کاربران باید یک کلید API معتبر داشته باشند. این کلید API به کاربران اجازه میدهد تا به سرویسهای مدل دسترسی پیدا کرده و از قابلیتهای آن بهرهمند شوند. برای دریافت کلید API، کاربران میتوانند به وبسایت ای آی کار (AI-KAR) مراجعه کرده و مراحل ثبتنام را طی کنند. پس از دریافت کلید API، کاربران میتوانند با استفاده از APIهای ارائه شده، تصاویر خود را به مدل ارسال کرده و تغییرات مورد نظر را اعمال کنند. این APIها به صورت مستند و با مثالهای کاربردی ارائه شدهاند تا کاربران بتوانند به راحتی از آنها استفاده کنند.
در نهایت، مدل seededit-3.0-image-to-image یک ابزار قدرتمند و کارآمد برای ویرایش تصاویر است که با ارائه کیفیت بالا و دقت فوقالعاده، به کاربران امکان میدهد تا به نتایج دلخواه خود دست یابند. این مدل با پشتیبانی از رزولوشن 4K، حفظ وفاداری بصری مناطق غیر ویرایش شده و قابلیت درک توضیحات متنی، یک انتخاب عالی برای تمامی کسانی است که به دنبال یک راه حل جامع و حرفهای برای ویرایش تصاویر خود هستند. استفاده از این مدل از طریق پلتفرم ای آی کار (AI-KAR) به سادگی امکان پذیر است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. مقدار ثابت: bytedance/seededit-3.0-i2i مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیح متنی که محتوا، سبک یا ترکیببندی تصویر تولیدی را شرح میدهد. |
image | stringRequired | تصویری که باید ویرایش شود. کد Base64 تصویر یا یک URL قابل دسترس را وارد کنید. URL تصویر: مطمئن شوید که URL تصویر قابل دسترسی است. محتوای کدگذاری شده Base64: فرمت باید با حروف کوچک باشد. |
size | string | مدل اندازه تصویر ورودی را با جدول اندازه داخلی خود بررسی میکند و نزدیکترین مطابقت را به عنوان اندازه تصویر خروجی انتخاب میکند. مقدار پیشفرض: adaptive مقادیر مجاز (کلیک برای کپی): |
seed | integer | همان seed و همان prompt که به همان نسخه از مدل داده میشود، هر بار یک تصویر یکسان را خروجی میدهد. |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه چقدر میخواهید مدل هنگام جستجوی یک تصویر مرتبط برای نشان دادن به شما، به prompt شما پایبند باشد. حداقل: 1، حداکثر: 10. مقدار پیشفرض: 2.5 |
response_format | string | فرمت بازگشت تصاویر تولید شده. مقدار پیشفرض: url مقادیر مجاز (کلیک برای کپی): |
watermark | boolean | منسوخ شده: اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیشفرض: false |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "bytedance/seededit-3.0-i2i",
"image": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
"prompt": "Add a bird to the foreground of the photo.",
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}