Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-dev

مستندات مدل تولید تصویر flux-dev از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک مفاهیم کلی را دارد اما ممکن است در جزئیات و ظرایف زبانی دچار مشکل شود.

مدل flux-dev یک مدل پیشرفته تولید تصویر است که از معماری ترانسفورمر جریان اصلاح شده با 12 میلیارد پارامتر بهره می‌برد. این مدل برای تولید تصاویر با کیفیت بالا از توضیحات متنی طراحی شده است و ابزاری قدرتمند برای توسعه‌دهندگان و افراد خلاق است. با استفاده از این مدل، کاربران می‌توانند با ارائه یک متن توصیفی، تصاویر متنوع و با کیفیتی را تولید کنند. این مدل قادر است تا مفاهیم پیچیده را درک کرده و تصاویری با جزئیات دقیق و سبک‌های هنری گوناگون ایجاد کند. مدل flux-dev به طور خاص برای تولید تصاویر با وضوح بالا و جزئیات دقیق بهینه شده است. این مدل از فرمت PNG برای تصاویر خروجی پشتیبانی می‌کند و اندازه تصاویر تولید شده می‌تواند بین 512x512 تا 1536x1536 پیکسل متغیر باشد. اندازه پیش‌فرض تصاویر تولید شده 1024x768 پیکسل است. توجه داشته باشید که مقادیر ارتفاع و عرض تصویر باید مضربی از 32 باشند. این مدل از طریق API قابل دسترسی است و کاربران می‌توانند با استفاده از کلید API خود، درخواست‌های تولید تصویر را ارسال کنند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در دسترس هستند، از جمله اندازه تصویر، مقیاس راهنمایی، تعداد مراحل استنتاج و غیره. با تنظیم این پارامترها، کاربران می‌توانند تصاویر خروجی را به دقت کنترل کرده و نتایج دلخواه خود را به دست آورند. مدل flux-dev با بهره‌گیری از تکنیک‌های پیشرفته یادگیری عمیق، قادر است تا تصاویر واقع‌گرایانه و هنری را با کیفیت بالا تولید کند. این مدل به طور مداوم در حال توسعه و بهبود است و ویژگی‌های جدیدی به آن اضافه می‌شود تا نیازهای کاربران را به بهترین شکل ممکن برآورده کند. این مدل برای کاربردهای مختلفی از جمله تولید محتوای بصری، طراحی گرافیکی، ایجاد نمونه‌های اولیه و غیره مناسب است. با استفاده از مدل flux-dev، کاربران می‌توانند ایده‌های خود را به سرعت و به آسانی به تصاویر واقعی تبدیل کنند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت `flux/dev` را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
image_size
object | string
اندازه تصویر تولید شده. می‌تواند یک شیء با مشخص کردن طول و عرض یا یک رشته از مقادیر enum باشد.
مقادیر مجاز (کلیک برای کپی):
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد.
num_inference_steps
integer
تعداد مراحل استنتاج برای انجام.
enable_safety_checker
boolean
اگر روی True تنظیم شود، بررسی کننده ایمنی فعال خواهد شد.
prompt
stringRequired
متن توصیفی محتوا، سبک یا ترکیب تصویر برای تولید.
num_images
number
تعداد تصاویری که باید تولید شوند.
seed
integer
همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را خروجی می‌دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "flux/dev",
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "images": [
    {
      "url": "#",
      "width": 1024,
      "height": 768,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {
    "inference": 1.226824438199401
  },
  "seed": 1765470393,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}