Image Modelsflux
معرفی و مستندات مدل هوش مصنوعی flux-kontext-max-image-to-image
مدل image-to-image با قابلیت تغییرات دقیق بر اساس دستورات متنی، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای بهترین نتیجه، استفاده از دستورات متنی ساده و واضح توصیه میشود.
مدل flux-kontext-max-image-to-image یک مدل تبدیل تصویر به تصویر است که به شما امکان میدهد تا تصاویر موجود را با استفاده از دستورات متنی تغییر دهید. این مدل، که توسط ای آی کار (AI-KAR) ارائه شده، به گونهای طراحی شده است که تنها بخشهایی از تصویر را که در دستور متنی مشخص شدهاند، تغییر دهد و بقیه تصویر را بدون تغییر باقی بگذارد. این ویژگی باعث میشود تا بتوانید تغییرات دقیقی را بر روی تصاویر اعمال کنید، بدون اینکه نگران از دست رفتن جزئیات اصلی تصویر باشید.
یکی از ویژگیهای برجسته این مدل، توانایی آن در حفظ کیفیت و وضوح تصویر است. مدل flux-kontext-max-image-to-image از الگوریتمهای پیشرفتهای استفاده میکند تا اطمینان حاصل شود که تصاویر تولید شده دارای کیفیت بالایی هستند و هیچ گونه اعوجاج یا نویزی در آنها وجود ندارد. این ویژگی برای کاربردهایی که نیاز به تصاویر با کیفیت بالا دارند، بسیار مهم است.
این مدل از فرمتهای JPEG و PNG برای تصاویر خروجی پشتیبانی میکند. اندازه تصویر به طور مستقیم قابل تنظیم نیست، اما میتوانید نسبت ابعاد از پیش تعیین شده را انتخاب کنید. نسبت ابعاد پیشفرض 16:9 و اندازه تصویر 1184x880 پیکسل است.
برای استفاده از این مدل، شما نیاز به یک کلید API دارید. اگر کلید API ندارید، میتوانید از راهنمای شروع سریع ما استفاده کنید. پس از دریافت کلید API، میتوانید از طریق API Schema ارائه شده، درخواستهای خود را ارسال کنید.
مدل flux-kontext-max-image-to-image دارای پارامترهای مختلفی است که به شما امکان میدهند تا خروجی مدل را کنترل کنید. به عنوان مثال، میتوانید از پارامتر `guidance_scale` برای تنظیم میزان پایبندی مدل به دستور متنی استفاده کنید. همچنین، میتوانید از پارامتر `safety_tolerance` برای تنظیم سطح سختگیری ایمنی تصویر تولید شده استفاده کنید.
این مدل برای کاربردهای مختلفی مناسب است، از جمله:
با استفاده از مدل flux-kontext-max-image-to-image، میتوانید به راحتی تصاویر خود را به شکل دلخواه تغییر دهید و نتایج شگفتانگیزی را به دست آورید. این مدل یک ابزار قدرتمند برای هنرمندان، طراحان و هر کسی است که به دنبال ایجاد تصاویر منحصر به فرد و جذاب است.
یکی از ویژگیهای برجسته این مدل، توانایی آن در حفظ کیفیت و وضوح تصویر است. مدل flux-kontext-max-image-to-image از الگوریتمهای پیشرفتهای استفاده میکند تا اطمینان حاصل شود که تصاویر تولید شده دارای کیفیت بالایی هستند و هیچ گونه اعوجاج یا نویزی در آنها وجود ندارد. این ویژگی برای کاربردهایی که نیاز به تصاویر با کیفیت بالا دارند، بسیار مهم است.
این مدل از فرمتهای JPEG و PNG برای تصاویر خروجی پشتیبانی میکند. اندازه تصویر به طور مستقیم قابل تنظیم نیست، اما میتوانید نسبت ابعاد از پیش تعیین شده را انتخاب کنید. نسبت ابعاد پیشفرض 16:9 و اندازه تصویر 1184x880 پیکسل است.
برای استفاده از این مدل، شما نیاز به یک کلید API دارید. اگر کلید API ندارید، میتوانید از راهنمای شروع سریع ما استفاده کنید. پس از دریافت کلید API، میتوانید از طریق API Schema ارائه شده، درخواستهای خود را ارسال کنید.
مدل flux-kontext-max-image-to-image دارای پارامترهای مختلفی است که به شما امکان میدهند تا خروجی مدل را کنترل کنید. به عنوان مثال، میتوانید از پارامتر `guidance_scale` برای تنظیم میزان پایبندی مدل به دستور متنی استفاده کنید. همچنین، میتوانید از پارامتر `safety_tolerance` برای تنظیم سطح سختگیری ایمنی تصویر تولید شده استفاده کنید.
این مدل برای کاربردهای مختلفی مناسب است، از جمله:
- تغییر ظاهر اشیاء در تصاویر
- اضافه کردن عناصر جدید به تصاویر
- بهبود کیفیت تصاویر
- تولید تصاویر خلاقانه و هنری
با استفاده از مدل flux-kontext-max-image-to-image، میتوانید به راحتی تصاویر خود را به شکل دلخواه تغییر دهید و نتایج شگفتانگیزی را به دست آورید. این مدل یک ابزار قدرتمند برای هنرمندان، طراحان و هر کسی است که به دنبال ایجاد تصاویر منحصر به فرد و جذاب است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت `flux/kontext-max/image-to-image` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد. مقدار باید بین 1 و 20 باشد. |
safety_tolerance | string | سطح تحمل ایمنی برای تصویر تولید شده. 1 سختگیرانهترین و 5 آزادترین حالت است. مقدار پیشفرض 2 است. مقادیر مجاز (کلیک برای کپی): |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض jpeg است. مقادیر مجاز (کلیک برای کپی): |
aspect_ratio | string | نسبت ابعاد تصویر تولید شده. مقدار پیشفرض 16:9 است. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن توصیفی محتوا، سبک یا ترکیب تصویر مورد نظر. حداکثر طول 4000 کاراکتر. |
num_images | number | تعداد تصاویری که باید تولید شوند. هر تصویر یک تلاش متفاوت برای ترکیب تصاویر مرجع (از پارامتر image_url) بر اساس دستور متنی است. مقدار باید بین 1 و 4 باشد. مقدار پیشفرض 1 است. |
seed | integer | با استفاده از یک seed ثابت و یک prompt یکسان، همیشه یک تصویر یکسان تولید میشود. مقدار باید حداقل 1 باشد. |
image_url | stringRequired | یک یا چند URL تصویر به عنوان مرجع بصری. مدل آنها را بر اساس دستور متنی در یک تصویر ادغام میکند. حداکثر 4 تصویر. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "flux/kontext-max/image-to-image",
"image_url": "https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png", # URL of the reference picture
"prompt": "Add a bird to the foreground of the photo.",
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}