Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-kontext-max-image-to-image

مدل image-to-image با قابلیت تغییرات دقیق بر اساس دستورات متنی، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای بهترین نتیجه، استفاده از دستورات متنی ساده و واضح توصیه می‌شود.

مدل flux-kontext-max-image-to-image یک مدل تبدیل تصویر به تصویر است که به شما امکان می‌دهد تا تصاویر موجود را با استفاده از دستورات متنی تغییر دهید. این مدل، که توسط ای آی کار (AI-KAR) ارائه شده، به گونه‌ای طراحی شده است که تنها بخش‌هایی از تصویر را که در دستور متنی مشخص شده‌اند، تغییر دهد و بقیه تصویر را بدون تغییر باقی بگذارد. این ویژگی باعث می‌شود تا بتوانید تغییرات دقیقی را بر روی تصاویر اعمال کنید، بدون اینکه نگران از دست رفتن جزئیات اصلی تصویر باشید.

یکی از ویژگی‌های برجسته این مدل، توانایی آن در حفظ کیفیت و وضوح تصویر است. مدل flux-kontext-max-image-to-image از الگوریتم‌های پیشرفته‌ای استفاده می‌کند تا اطمینان حاصل شود که تصاویر تولید شده دارای کیفیت بالایی هستند و هیچ گونه اعوجاج یا نویزی در آن‌ها وجود ندارد. این ویژگی برای کاربردهایی که نیاز به تصاویر با کیفیت بالا دارند، بسیار مهم است.

این مدل از فرمت‌های JPEG و PNG برای تصاویر خروجی پشتیبانی می‌کند. اندازه تصویر به طور مستقیم قابل تنظیم نیست، اما می‌توانید نسبت ابعاد از پیش تعیین شده را انتخاب کنید. نسبت ابعاد پیش‌فرض 16:9 و اندازه تصویر 1184x880 پیکسل است.

برای استفاده از این مدل، شما نیاز به یک کلید API دارید. اگر کلید API ندارید، می‌توانید از راهنمای شروع سریع ما استفاده کنید. پس از دریافت کلید API، می‌توانید از طریق API Schema ارائه شده، درخواست‌های خود را ارسال کنید.

مدل flux-kontext-max-image-to-image دارای پارامترهای مختلفی است که به شما امکان می‌دهند تا خروجی مدل را کنترل کنید. به عنوان مثال، می‌توانید از پارامتر `guidance_scale` برای تنظیم میزان پایبندی مدل به دستور متنی استفاده کنید. همچنین، می‌توانید از پارامتر `safety_tolerance` برای تنظیم سطح سخت‌گیری ایمنی تصویر تولید شده استفاده کنید.

این مدل برای کاربردهای مختلفی مناسب است، از جمله:

تغییر ظاهر اشیاء در تصاویر
اضافه کردن عناصر جدید به تصاویر
بهبود کیفیت تصاویر
تولید تصاویر خلاقانه و هنری

با استفاده از مدل flux-kontext-max-image-to-image، می‌توانید به راحتی تصاویر خود را به شکل دلخواه تغییر دهید و نتایج شگفت‌انگیزی را به دست آورید. این مدل یک ابزار قدرتمند برای هنرمندان، طراحان و هر کسی است که به دنبال ایجاد تصاویر منحصر به فرد و جذاب است.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت `flux/kontext-max/image-to-image` را بپذیرید. مقادیر مجاز (کلیک برای کپی):
guidance_scale	number	مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد. مقدار باید بین 1 و 20 باشد.
safety_tolerance	string	سطح تحمل ایمنی برای تصویر تولید شده. 1 سخت‌گیرانه‌ترین و 5 آزادترین حالت است. مقدار پیش‌فرض 2 است. مقادیر مجاز (کلیک برای کپی):
output_format	string	فرمت تصویر تولید شده. مقدار پیش‌فرض jpeg است. مقادیر مجاز (کلیک برای کپی):
aspect_ratio	string	نسبت ابعاد تصویر تولید شده. مقدار پیش‌فرض 16:9 است. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	متن توصیفی محتوا، سبک یا ترکیب تصویر مورد نظر. حداکثر طول 4000 کاراکتر.
num_images	number	تعداد تصاویری که باید تولید شوند. هر تصویر یک تلاش متفاوت برای ترکیب تصاویر مرجع (از پارامتر image_url) بر اساس دستور متنی است. مقدار باید بین 1 و 4 باشد. مقدار پیش‌فرض 1 است.
seed	integer	با استفاده از یک seed ثابت و یک prompt یکسان، همیشه یک تصویر یکسان تولید می‌شود. مقدار باید حداقل 1 باشد.
image_url	stringRequired	یک یا چند URL تصویر به عنوان مرجع بصری. مدل آن‌ها را بر اساس دستور متنی در یک تصویر ادغام می‌کند. حداکثر 4 تصویر.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "flux/kontext-max/image-to-image",
            "image_url": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",  # URL of the reference picture
            "prompt": "Add a bird to the foreground of the photo.",
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}