Image Modelsflux

معرفی و مستندات مدل هوش مصنوعی flux-realism

مستندات مدل تولید تصویر flux-realism از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، استفاده از توضیحات انگلیسی توصیه می‌شود.

مدل flux-realism یک مدل پیشرفته است که برای تولید تصاویر فوتورئالیستی از توضیحات متنی طراحی شده است. این مدل به کاربران اجازه می‌دهد تا تصاویر واقعی و زنده را بدون نیاز به استفاده از دستورات پیچیده مربوط به واقع‌گرایی ایجاد کنند. این مدل با بهره‌گیری از تکنیک‌های نوین در زمینه شبکه‌های عصبی مولد، قادر است تصاویر با جزئیات بالا و کیفیت بصری فوق‌العاده تولید کند. کاربران می‌توانند با ارائه یک متن ساده، تصویری با جزئیات دقیق و رنگ‌های زنده دریافت کنند. این مدل برای کاربردهای مختلفی از جمله طراحی گرافیک، تولید محتوای بصری برای وب‌سایت‌ها و شبکه‌های اجتماعی، و همچنین ایجاد تصاویر مفهومی برای پروژه‌های هنری مناسب است. یکی از ویژگی‌های برجسته این مدل، توانایی آن در درک و تفسیر دقیق دستورات متنی است. این به این معنی است که کاربران می‌توانند با استفاده از عبارات و جملات طبیعی، تصاویر مورد نظر خود را توصیف کنند و مدل به طور خودکار جزئیات لازم را برای تولید تصویر بهینه استخراج می‌کند. علاوه بر این، مدل flux-realism قابلیت تنظیم پارامترهای مختلفی را نیز فراهم می‌کند که به کاربران امکان می‌دهد تا کنترل بیشتری بر روی خروجی نهایی داشته باشند. به عنوان مثال، کاربران می‌توانند اندازه تصویر، میزان جزئیات، و سبک هنری تصویر را تنظیم کنند. این ویژگی‌ها باعث می‌شود که مدل flux-realism یک ابزار قدرتمند و انعطاف‌پذیر برای تولید تصاویر فوتورئالیستی باشد. همچنین، این مدل به طور مداوم در حال بهبود و به‌روزرسانی است تا با آخرین پیشرفت‌ها در زمینه هوش مصنوعی همگام باشد و بهترین عملکرد را ارائه دهد. تیم توسعه‌دهنده ای آی کار (AI-KAR) همواره در تلاش است تا این مدل را به یک ابزار بی‌نظیر برای تولید تصاویر با کیفیت بالا تبدیل کند. این مدل با پشتیبانی از فرمت‌های مختلف تصویر مانند JPEG و PNG، به کاربران امکان می‌دهد تا تصاویر تولید شده را به راحتی در پروژه‌های مختلف خود استفاده کنند. همچنین، با ارائه API ساده و کاربرپسند، توسعه‌دهندگان می‌توانند به راحتی این مدل را در برنامه‌های خود ادغام کنند و از قابلیت‌های آن بهره‌مند شوند. در نهایت، مدل flux-realism یک انتخاب عالی برای کسانی است که به دنبال تولید تصاویر فوتورئالیستی با کیفیت بالا و بدون نیاز به دانش تخصصی در زمینه طراحی گرافیک هستند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدلی که برای تولید تصویر استفاده می‌شود.
مقادیر مجاز (کلیک برای کپی):
image_size
object | string
اندازه تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد.
num_inference_steps
integer
تعداد مراحل استنتاج برای انجام.
enable_safety_checker
boolean
اگر روی True تنظیم شود، بررسی کننده ایمنی فعال خواهد شد.
مقادیر مجاز (کلیک برای کپی):
output_format
string
فرمت تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
num_images
number
تعداد تصاویری که باید تولید شوند. این مقدار برای خروجی استریم همیشه روی 1 تنظیم شده است.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن توصیفی محتوا، سبک یا ترکیب تصویر برای تولید.
seed
integer
همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را خروجی می‌دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "flux-realism",
            "image_size": {
                "width": 1472,
                "height": 512
            }
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "images": [
    {
      "url": "#",
      "width": 1472,
      "height": 512,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {
    "inference": 4.4450759180035675
  },
  "seed": 3082066483,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}