Image Modelsbytedance

معرفی و مستندات مدل هوش مصنوعی seededit-3.0-image-to-image

مستندات مدل seededit-3.0-image-to-image ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از توضیحات (prompt) انگلیسی توصیه می‌شود.

معرفی مدل seededit-3.0-image-to-image

مدل seededit-3.0-image-to-image یک مدل پیشرفته تولید تصویر است که توسط bytedance توسعه داده شده است. این مدل با هدف ویرایش تصاویر موجود با دقت و کیفیت بالا طراحی شده است. یکی از ویژگی‌های برجسته این مدل، توانایی پردازش و تولید تصاویر با رزولوشن 4K است که امکان ایجاد تغییرات دقیق و طبیعی را فراهم می‌کند. این مدل به طور خاص برای ویرایش مناطق انتخاب شده در تصاویر طراحی شده است، به طوری که تغییرات اعمال شده به صورت طبیعی و یکپارچه با سایر بخش‌های تصویر ترکیب می‌شوند. این امر باعث می‌شود تا خروجی نهایی، تصویری با کیفیت و بدون نقص باشد.

یکی از مزایای کلیدی این مدل، حفظ وفاداری بصری مناطق غیر ویرایش شده است. به این معنا که هنگام اعمال تغییرات در یک بخش خاص از تصویر، سایر بخش‌ها بدون تغییر باقی می‌مانند و کیفیت اصلی خود را حفظ می‌کنند. این ویژگی برای کاربرانی که نیاز به ویرایش دقیق و جزئی تصاویر دارند، بسیار حائز اهمیت است. مدل seededit-3.0-image-to-image قادر است تا با دریافت یک تصویر و یک توضیح متنی (prompt)، تغییرات مورد نظر را در تصویر اعمال کند. این توضیحات می‌توانند شامل تغییر در محتوا، سبک یا ترکیب‌بندی تصویر باشند.

به عنوان مثال، کاربر می‌تواند با ارائه یک تصویر از یک منظره طبیعی و یک توضیح متنی مانند "اضافه کردن یک آبشار به تصویر"، مدل را وادار به ایجاد یک آبشار در تصویر کند. مدل با تحلیل تصویر و درک توضیح متنی، به طور خودکار آبشار را به تصویر اضافه می‌کند، به طوری که با سایر عناصر تصویر هماهنگ باشد و به نظر طبیعی برسد. این مدل در زمینه‌های مختلفی کاربرد دارد. از جمله این کاربردها می‌توان به ویرایش عکس‌های شخصی، ایجاد تصاویر تبلیغاتی، طراحی گرافیکی و تولید محتوای بصری برای شبکه‌های اجتماعی اشاره کرد. با استفاده از این مدل، کاربران می‌توانند به راحتی و با سرعت بالا، تصاویر خود را ویرایش کرده و به نتایج دلخواه دست یابند.

برای استفاده از مدل seededit-3.0-image-to-image، کاربران باید یک کلید API معتبر داشته باشند. این کلید API به کاربران اجازه می‌دهد تا به سرویس‌های مدل دسترسی پیدا کرده و از قابلیت‌های آن بهره‌مند شوند. برای دریافت کلید API، کاربران می‌توانند به وب‌سایت ای آی کار (AI-KAR) مراجعه کرده و مراحل ثبت‌نام را طی کنند. پس از دریافت کلید API، کاربران می‌توانند با استفاده از APIهای ارائه شده، تصاویر خود را به مدل ارسال کرده و تغییرات مورد نظر را اعمال کنند. این APIها به صورت مستند و با مثال‌های کاربردی ارائه شده‌اند تا کاربران بتوانند به راحتی از آن‌ها استفاده کنند.

در نهایت، مدل seededit-3.0-image-to-image یک ابزار قدرتمند و کارآمد برای ویرایش تصاویر است که با ارائه کیفیت بالا و دقت فوق‌العاده، به کاربران امکان می‌دهد تا به نتایج دلخواه خود دست یابند. این مدل با پشتیبانی از رزولوشن 4K، حفظ وفاداری بصری مناطق غیر ویرایش شده و قابلیت درک توضیحات متنی، یک انتخاب عالی برای تمامی کسانی است که به دنبال یک راه حل جامع و حرفه‌ای برای ویرایش تصاویر خود هستند. استفاده از این مدل از طریق پلتفرم ای آی کار (AI-KAR) به سادگی امکان پذیر است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار ثابت: bytedance/seededit-3.0-i2i
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
توضیح متنی که محتوا، سبک یا ترکیب‌بندی تصویر تولیدی را شرح می‌دهد.
image
stringRequired
تصویری که باید ویرایش شود. کد Base64 تصویر یا یک URL قابل دسترس را وارد کنید. URL تصویر: مطمئن شوید که URL تصویر قابل دسترسی است. محتوای کدگذاری شده Base64: فرمت باید با حروف کوچک باشد.
size
string
مدل اندازه تصویر ورودی را با جدول اندازه داخلی خود بررسی می‌کند و نزدیکترین مطابقت را به عنوان اندازه تصویر خروجی انتخاب می‌کند. مقدار پیش‌فرض: adaptive
مقادیر مجاز (کلیک برای کپی):
seed
integer
همان seed و همان prompt که به همان نسخه از مدل داده می‌شود، هر بار یک تصویر یکسان را خروجی می‌دهد.
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه چقدر می‌خواهید مدل هنگام جستجوی یک تصویر مرتبط برای نشان دادن به شما، به prompt شما پایبند باشد. حداقل: 1، حداکثر: 10. مقدار پیش‌فرض: 2.5
response_format
string
فرمت بازگشت تصاویر تولید شده. مقدار پیش‌فرض: url
مقادیر مجاز (کلیک برای کپی):
watermark
boolean
منسوخ شده: اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیش‌فرض: false

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "bytedance/seededit-3.0-i2i",
            "image": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
            "prompt": "Add a bird to the foreground of the photo.",
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}