Image Modelsflux
معرفی و مستندات مدل هوش مصنوعی flux-dev
مستندات مدل تولید تصویر flux-dev از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک مفاهیم کلی را دارد اما ممکن است در جزئیات و ظرایف زبانی دچار مشکل شود.
مدل flux-dev یک مدل پیشرفته تولید تصویر است که از معماری ترانسفورمر جریان اصلاح شده با 12 میلیارد پارامتر بهره میبرد. این مدل برای تولید تصاویر با کیفیت بالا از توضیحات متنی طراحی شده است و ابزاری قدرتمند برای توسعهدهندگان و افراد خلاق است. با استفاده از این مدل، کاربران میتوانند با ارائه یک متن توصیفی، تصاویر متنوع و با کیفیتی را تولید کنند. این مدل قادر است تا مفاهیم پیچیده را درک کرده و تصاویری با جزئیات دقیق و سبکهای هنری گوناگون ایجاد کند. مدل flux-dev به طور خاص برای تولید تصاویر با وضوح بالا و جزئیات دقیق بهینه شده است. این مدل از فرمت PNG برای تصاویر خروجی پشتیبانی میکند و اندازه تصاویر تولید شده میتواند بین 512x512 تا 1536x1536 پیکسل متغیر باشد. اندازه پیشفرض تصاویر تولید شده 1024x768 پیکسل است. توجه داشته باشید که مقادیر ارتفاع و عرض تصویر باید مضربی از 32 باشند. این مدل از طریق API قابل دسترسی است و کاربران میتوانند با استفاده از کلید API خود، درخواستهای تولید تصویر را ارسال کنند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در دسترس هستند، از جمله اندازه تصویر، مقیاس راهنمایی، تعداد مراحل استنتاج و غیره. با تنظیم این پارامترها، کاربران میتوانند تصاویر خروجی را به دقت کنترل کرده و نتایج دلخواه خود را به دست آورند. مدل flux-dev با بهرهگیری از تکنیکهای پیشرفته یادگیری عمیق، قادر است تا تصاویر واقعگرایانه و هنری را با کیفیت بالا تولید کند. این مدل به طور مداوم در حال توسعه و بهبود است و ویژگیهای جدیدی به آن اضافه میشود تا نیازهای کاربران را به بهترین شکل ممکن برآورده کند. این مدل برای کاربردهای مختلفی از جمله تولید محتوای بصری، طراحی گرافیکی، ایجاد نمونههای اولیه و غیره مناسب است. با استفاده از مدل flux-dev، کاربران میتوانند ایدههای خود را به سرعت و به آسانی به تصاویر واقعی تبدیل کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت `flux/dev` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
image_size | object | string | اندازه تصویر تولید شده. میتواند یک شیء با مشخص کردن طول و عرض یا یک رشته از مقادیر enum باشد. مقادیر مجاز (کلیک برای کپی): |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد. |
num_inference_steps | integer | تعداد مراحل استنتاج برای انجام. |
enable_safety_checker | boolean | اگر روی True تنظیم شود، بررسی کننده ایمنی فعال خواهد شد. |
prompt | stringRequired | متن توصیفی محتوا، سبک یا ترکیب تصویر برای تولید. |
num_images | number | تعداد تصاویری که باید تولید شوند. |
seed | integer | همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را خروجی میدهد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "flux/dev",
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"images": [
{
"url": "#",
"width": 1024,
"height": 768,
"content_type": "image/jpeg"
}
],
"timings": {
"inference": 1.226824438199401
},
"seed": 1765470393,
"has_nsfw_concepts": [
false
],
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}