Image Modelsflux
معرفی و مستندات مدل هوش مصنوعی flux-kontext-pro-image-to-image
مستندات مدل image-to-image از flux، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی در prompt به صورت متوسط پشتیبانی میکند. برای نتایج بهتر، توصیه میشود از prompt های ساده و واضح استفاده کنید.
مدل flux-kontext-pro-image-to-image یک مدل تبدیل تصویر به تصویر است که توسط شرکت flux توسعه داده شده و توسط ای آی کار (AI-KAR) ارائه میشود. این مدل به شما امکان میدهد تا با استفاده از یک prompt متنی، تغییرات دلخواه خود را بر روی یک یا چند تصویر ورودی اعمال کنید. ویژگی منحصر به فرد این مدل این است که تنها بخشهایی از تصویر را که در prompt مشخص کردهاید تغییر میدهد و بقیه قسمتهای تصویر را دست نخورده باقی میگذارد. این امر باعث میشود تا نتایج تولید شده بسیار دقیق و با کیفیت باشند.
به عنوان مثال، میتوانید با استفاده از این مدل، یک تاج به سر یک دایناسور اضافه کنید، یک پرنده را به پیشزمینه یک عکس اضافه کنید، یا حتی دو تصویر مختلف را با هم ترکیب کنید. این مدل از فرمتهای JPEG و PNG برای تصاویر ورودی و خروجی پشتیبانی میکند. اندازه تصویر خروجی به طور مستقیم قابل تنظیم نیست، اما میتوانید نسبت ابعاد مورد نظر خود را از بین مقادیر پیشفرض انتخاب کنید. نسبت ابعاد پیشفرض 16:9 با اندازه 1184x880 پیکسل است.
برای استفاده از این مدل، باید یک API Key معتبر از ای آی کار (AI-KAR) داشته باشید. سپس میتوانید با ارسال یک درخواست POST به آدرس `https://api.ai-kar.com/v1/images/generations` و ارائه پارامترهای مورد نیاز، تصویر مورد نظر خود را تولید کنید. پارامترهای اصلی شامل `model` (که باید برابر با `flux/kontext-pro/image-to-image` باشد)، `prompt` (متن توضیحی تغییرات مورد نظر)، و `image_url` (آدرس URL تصویر یا تصاویر ورودی) هستند.
این مدل از الگوریتم Classifier Free Guidance (CFG) استفاده میکند که به شما امکان میدهد میزان تطابق تصویر تولید شده با prompt را کنترل کنید. پارامتر `guidance_scale` این میزان را تعیین میکند و مقادیر بین 1 تا 20 را میپذیرد. همچنین، میتوانید سطح تحمل ایمنی (safety tolerance) را با استفاده از پارامتر `safety_tolerance` تنظیم کنید. این پارامتر مقادیری بین 1 (بیشترین سختگیری) تا 5 (بیشترین آزادی) را میپذیرد.
با استفاده از مدل flux-kontext-pro-image-to-image، میتوانید به راحتی و با دقت بالا، تصاویر خود را ویرایش و تغییر دهید و نتایج خلاقانهای را ایجاد کنید. این مدل ابزاری قدرتمند برای طراحان، هنرمندان، و هر کسی است که به دنبال ایجاد تصاویر منحصر به فرد و جذاب است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. باید `flux/kontext-pro/image-to-image` باشد. مقادیر مجاز (کلیک برای کپی): |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance). معیاری از میزان تمایل مدل به پیروی از prompt شما هنگام جستجو برای یک تصویر مرتبط برای نمایش به شما. مقدار باید بین 1 و 20 باشد. |
safety_tolerance | string | سطح تحمل ایمنی برای تصویر تولید شده. 1 سختگیرانه ترین و 5 آزادترین است. مقدار پیشفرض 2 است. مقادیر مجاز (کلیک برای کپی): |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض jpeg است. مقادیر مجاز (کلیک برای کپی): |
aspect_ratio | string | نسبت ابعاد تصویر تولید شده. مقدار پیشفرض 16:9 است. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن prompt که محتوا، سبک یا ترکیب تصویر مورد نظر را توصیف میکند. حداکثر طول 4000 کاراکتر. |
num_images | number | تعداد تصاویر مختلف برای تولید. هر تصویر یک تلاش متفاوت برای ترکیب تصاویر مرجع (از پارامتر image_url) مطابق با prompt است. مقدار پیشفرض 1 است. |
seed | integer | همان seed و همان prompt که به همان نسخه از مدل داده میشود، هر بار یک تصویر یکسان را خروجی میدهد. |
image_url | stringRequired | یک یا چند URL تصویر که به عنوان مرجع بصری استفاده میشوند. مدل آنها را در یک تصویر واحد با پیروی از دستورالعملهای prompt ادغام میکند. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
"Authorization": "Bearer <YOUR_API_KEY>",
"Content-Type": "application/json",
},
json={
"model": "flux/kontext-pro/image-to-image",
"image_url": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
"prompt": "Add a bird to the foreground of the photo.",
},
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}