Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-kontext-max-text-to-image

مستندات مدل تولید تصویر از متن flux-kontext-max-text-to-image، ارائه شده توسط ای ای کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند و ممکن است در درک مفاهیم پیچیده فارسی با مشکل مواجه شود.

مدل flux-kontext-max-text-to-image یک مدل هوش مصنوعی پیشرفته برای تولید تصاویر با کیفیت بالا از توضیحات متنی است. این مدل که توسط تیم AI-KAR توسعه داده شده، با هدف ارائه تصاویری واقع‌گرایانه و دقیق بر اساس ورودی متنی طراحی شده است. این مدل از معماری شبکه‌های عصبی عمیق بهره می‌برد و قادر است مفاهیم پیچیده و جزئیات دقیق را از متن درک کرده و به تصویر تبدیل کند. کاربران می‌توانند با ارائه توضیحات متنی خلاقانه، تصاویری با سبک‌ها و موضوعات مختلف ایجاد کنند. این مدل برای کاربردهای گوناگونی از جمله طراحی گرافیک، تولید محتوای بصری، هنر دیجیتال و تحقیقات علمی مناسب است. یکی از ویژگی‌های برجسته این مدل، توانایی آن در تولید تصاویر با رزولوشن بالا و جزئیات دقیق است. این امر به کاربران امکان می‌دهد تا تصاویری با کیفیت چاپ تولید کرده و در پروژه‌های حرفه‌ای خود استفاده کنند. همچنین، مدل flux-kontext-max-text-to-image از قابلیت تنظیم پارامترهای مختلف برخوردار است که به کاربران اجازه می‌دهد تا خروجی نهایی را به دقت کنترل کنند. این پارامترها شامل مقیاس راهنمایی (guidance scale)، سطح تحمل ایمنی (safety tolerance) و نسبت تصویر (aspect ratio) می‌شوند. با تنظیم این پارامترها، کاربران می‌توانند تصاویری تولید کنند که دقیقاً با نیازها و ترجیحات آن‌ها مطابقت داشته باشد. علاوه بر این، این مدل از زبان‌های مختلف پشتیبانی می‌کند و کاربران می‌توانند توضیحات متنی خود را به زبان‌های گوناگون ارائه دهند. این ویژگی به کاربران بین‌المللی امکان می‌دهد تا به راحتی از این مدل استفاده کرده و تصاویری با کیفیت بالا تولید کنند. تیم AI-KAR به طور مداوم در حال بهبود و توسعه این مدل است و تلاش می‌کند تا با ارائه ویژگی‌های جدید و بهبود عملکرد، تجربه کاربری را ارتقا دهد. در آینده، انتظار می‌رود که این مدل قابلیت‌های بیشتری از جمله تولید تصاویر سه‌بعدی و انیمیشن را نیز پشتیبانی کند. مدل flux-kontext-max-text-to-image یک ابزار قدرتمند و کارآمد برای تولید تصاویر از متن است که به کاربران امکان می‌دهد تا ایده‌های خلاقانه خود را به واقعیت تبدیل کنند. این مدل با ارائه کیفیت بالا، انعطاف‌پذیری و سهولت استفاده، به یکی از محبوب‌ترین ابزارهای تولید تصویر در دنیای هوش مصنوعی تبدیل شده است.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت: flux/kontext-max/text-to-image مقادیر مجاز (کلیک برای کپی):
guidance_scale	number	مقیاس CFG (Classifier Free Guidance) نشان می‌دهد که مدل چقدر باید به درخواست شما پایبند باشد. مقدار بین 1 و 20.
safety_tolerance	string	سطح تحمل ایمنی برای تصویر تولید شده. 1 سخت‌گیرانه‌ترین و 5 آزادترین حالت است. مقدار پیش‌فرض: 2 مقادیر مجاز (کلیک برای کپی):
output_format	string	فرمت تصویر تولید شده. مقدار پیش‌فرض: jpeg مقادیر مجاز (کلیک برای کپی):
aspect_ratio	string	نسبت تصویر تولید شده. مقدار پیش‌فرض: 16:9 مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	توضیحات متنی که محتوا، سبک یا ترکیب تصویر را مشخص می‌کند. حداکثر 4000 کاراکتر.
num_images	number	تعداد تصاویری که باید تولید شود. مقدار پیش‌فرض: 1، حداقل 1 و حداکثر 4.
seed	integer	با استفاده از یک seed ثابت، با همان prompt و نسخه مدل، همیشه یک تصویر یکسان تولید می‌شود. حداقل مقدار: 1

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "flux/kontext-max/text-to-image",
            "aspect_ratio": '21:9'
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "images": [
    {
      "url": "#",
      "width": 1568,
      "height": 672,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {},
  "seed": 1617845674,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}