Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-kontext-pro-image-to-image

مستندات مدل image-to-image از flux، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی در prompt به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، توصیه می‌شود از prompt های ساده و واضح استفاده کنید.

مدل flux-kontext-pro-image-to-image یک مدل تبدیل تصویر به تصویر است که توسط شرکت flux توسعه داده شده و توسط ای آی کار (AI-KAR) ارائه می‌شود. این مدل به شما امکان می‌دهد تا با استفاده از یک prompt متنی، تغییرات دلخواه خود را بر روی یک یا چند تصویر ورودی اعمال کنید. ویژگی منحصر به فرد این مدل این است که تنها بخش‌هایی از تصویر را که در prompt مشخص کرده‌اید تغییر می‌دهد و بقیه قسمت‌های تصویر را دست نخورده باقی می‌گذارد. این امر باعث می‌شود تا نتایج تولید شده بسیار دقیق و با کیفیت باشند.

به عنوان مثال، می‌توانید با استفاده از این مدل، یک تاج به سر یک دایناسور اضافه کنید، یک پرنده را به پیش‌زمینه یک عکس اضافه کنید، یا حتی دو تصویر مختلف را با هم ترکیب کنید. این مدل از فرمت‌های JPEG و PNG برای تصاویر ورودی و خروجی پشتیبانی می‌کند. اندازه تصویر خروجی به طور مستقیم قابل تنظیم نیست، اما می‌توانید نسبت ابعاد مورد نظر خود را از بین مقادیر پیش‌فرض انتخاب کنید. نسبت ابعاد پیش‌فرض 16:9 با اندازه 1184x880 پیکسل است.

برای استفاده از این مدل، باید یک API Key معتبر از ای آی کار (AI-KAR) داشته باشید. سپس می‌توانید با ارسال یک درخواست POST به آدرس `https://api.ai-kar.com/v1/images/generations` و ارائه پارامترهای مورد نیاز، تصویر مورد نظر خود را تولید کنید. پارامترهای اصلی شامل `model` (که باید برابر با `flux/kontext-pro/image-to-image` باشد)، `prompt` (متن توضیحی تغییرات مورد نظر)، و `image_url` (آدرس URL تصویر یا تصاویر ورودی) هستند.

این مدل از الگوریتم Classifier Free Guidance (CFG) استفاده می‌کند که به شما امکان می‌دهد میزان تطابق تصویر تولید شده با prompt را کنترل کنید. پارامتر `guidance_scale` این میزان را تعیین می‌کند و مقادیر بین 1 تا 20 را می‌پذیرد. همچنین، می‌توانید سطح تحمل ایمنی (safety tolerance) را با استفاده از پارامتر `safety_tolerance` تنظیم کنید. این پارامتر مقادیری بین 1 (بیشترین سخت‌گیری) تا 5 (بیشترین آزادی) را می‌پذیرد.

با استفاده از مدل flux-kontext-pro-image-to-image، می‌توانید به راحتی و با دقت بالا، تصاویر خود را ویرایش و تغییر دهید و نتایج خلاقانه‌ای را ایجاد کنید. این مدل ابزاری قدرتمند برای طراحان، هنرمندان، و هر کسی است که به دنبال ایجاد تصاویر منحصر به فرد و جذاب است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. باید `flux/kontext-pro/image-to-image` باشد.
مقادیر مجاز (کلیک برای کپی):
guidance_scale
number
مقیاس CFG (Classifier Free Guidance). معیاری از میزان تمایل مدل به پیروی از prompt شما هنگام جستجو برای یک تصویر مرتبط برای نمایش به شما. مقدار باید بین 1 و 20 باشد.
safety_tolerance
string
سطح تحمل ایمنی برای تصویر تولید شده. 1 سختگیرانه ترین و 5 آزادترین است. مقدار پیش‌فرض 2 است.
مقادیر مجاز (کلیک برای کپی):
output_format
string
فرمت تصویر تولید شده. مقدار پیش‌فرض jpeg است.
مقادیر مجاز (کلیک برای کپی):
aspect_ratio
string
نسبت ابعاد تصویر تولید شده. مقدار پیش‌فرض 16:9 است.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن prompt که محتوا، سبک یا ترکیب تصویر مورد نظر را توصیف می‌کند. حداکثر طول 4000 کاراکتر.
num_images
number
تعداد تصاویر مختلف برای تولید. هر تصویر یک تلاش متفاوت برای ترکیب تصاویر مرجع (از پارامتر image_url) مطابق با prompt است. مقدار پیش‌فرض 1 است.
seed
integer
همان seed و همان prompt که به همان نسخه از مدل داده می‌شود، هر بار یک تصویر یکسان را خروجی می‌دهد.
image_url
stringRequired
یک یا چند URL تصویر که به عنوان مرجع بصری استفاده می‌شوند. مدل آنها را در یک تصویر واحد با پیروی از دستورالعمل‌های prompt ادغام می‌کند.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            "Authorization": "Bearer <YOUR_API_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "flux/kontext-pro/image-to-image",
            "image_url": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
            "prompt": "Add a bird to the foreground of the photo.",
        },
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}