Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-kontext-pro-text-to-image

مستندات مدل تولید تصویر از متن flux-kontext-pro-text-to-image ارائه شده توسط ای ای کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، استفاده از ترجمه انگلیسی توصیه می‌شود.

مدل flux-kontext-pro-text-to-image یک مدل هوش مصنوعی پیشرفته برای تولید تصاویر با کیفیت بالا از توضیحات متنی است. این مدل که توسط Flux توسعه داده شده، با هدف ارائه سرعت و دقت بالا در تولید تصاویر طراحی شده است. این مدل قادر است با دریافت یک متن توصیفی (prompt)، تصویری مرتبط و با کیفیت تولید کند. کاربران می‌توانند با استفاده از این مدل، تصاویر متنوعی را با سبک‌ها و جزئیات مختلف ایجاد کنند. این مدل از پارامترهای مختلفی برای کنترل دقیق‌تر فرآیند تولید تصویر پشتیبانی می‌کند، از جمله تنظیم مقیاس CFG (Classifier Free Guidance) برای تعیین میزان تطابق تصویر با متن ورودی، تعیین سطح تحمل ایمنی برای فیلتر کردن محتوای نامناسب، انتخاب فرمت خروجی تصویر (JPEG یا PNG) و تعیین نسبت تصویر. همچنین، کاربران می‌توانند تعداد تصاویر تولیدی و یک مقدار seed برای تکرارپذیری نتایج تعیین کنند. این مدل به ویژه برای کاربردهایی که نیاز به تولید سریع و با کیفیت تصاویر از متن دارند، مناسب است. با استفاده از API ارائه شده توسط ای ای کار (AI-KAR)، توسعه‌دهندگان می‌توانند به راحتی این مدل را در برنامه‌ها و سرویس‌های خود ادغام کنند و از قابلیت‌های آن بهره‌مند شوند. این مدل با پشتیبانی از فرمت‌های مختلف تصویر و امکان تنظیم پارامترهای گوناگون، انعطاف‌پذیری بالایی را برای کاربران فراهم می‌کند. مدل flux-kontext-pro-text-to-image یک ابزار قدرتمند برای تولید تصاویر خلاقانه و کاربردی از متن است و می‌تواند در زمینه‌های مختلفی مانند طراحی گرافیک، تولید محتوا و آموزش مورد استفاده قرار گیرد. این مدل با ارائه نتایج با کیفیت و سرعت بالا، به کاربران کمک می‌کند تا ایده‌های خود را به سرعت به تصاویر واقعی تبدیل کنند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت: flux/kontext-pro/text-to-image مقادیر مجاز (کلیک برای کپی):
guidance_scale	number	مقیاس CFG (Classifier Free Guidance) که میزان تطابق تصویر با متن ورودی را تعیین می‌کند. حداقل مقدار 1 و حداکثر مقدار 20 است.
safety_tolerance	string	سطح تحمل ایمنی برای تصویر تولید شده. 1 سخت‌گیرانه‌ترین و 5 آزادترین حالت است. مقدار پیش‌فرض: 2 مقادیر مجاز (کلیک برای کپی):
output_format	string	فرمت تصویر تولید شده. مقدار پیش‌فرض: jpeg مقادیر مجاز (کلیک برای کپی):
aspect_ratio	string	نسبت تصویر تولید شده. مقدار پیش‌فرض: 16:9 مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	متن توصیفی که محتوا، سبک یا ترکیب تصویر را مشخص می‌کند. حداکثر طول: 4000 کاراکتر
num_images	number	تعداد تصاویر تولیدی. حداقل مقدار 1 و حداکثر مقدار 4 است. مقدار پیش‌فرض: 1
seed	integer	مقدار seed برای تکرارپذیری نتایج. با استفاده از یک seed ثابت، با همان متن ورودی و مدل، همیشه یک تصویر یکسان تولید می‌شود. حداقل مقدار: 1

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "flux/kontext-pro/text-to-image",
            "aspect_ratio": "21:9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "images": [
    {
      "url": "#",
      "width": 1568,
      "height": 672,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {},
  "seed": 2561481494,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}