Image Modelsflux
معرفی و مستندات مدل هوش مصنوعی flux-kontext-pro-text-to-image
مستندات مدل تولید تصویر از متن flux-kontext-pro-text-to-image ارائه شده توسط ای ای کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای نتایج بهتر، استفاده از ترجمه انگلیسی توصیه میشود.
مدل flux-kontext-pro-text-to-image یک مدل هوش مصنوعی پیشرفته برای تولید تصاویر با کیفیت بالا از توضیحات متنی است. این مدل که توسط Flux توسعه داده شده، با هدف ارائه سرعت و دقت بالا در تولید تصاویر طراحی شده است. این مدل قادر است با دریافت یک متن توصیفی (prompt)، تصویری مرتبط و با کیفیت تولید کند. کاربران میتوانند با استفاده از این مدل، تصاویر متنوعی را با سبکها و جزئیات مختلف ایجاد کنند. این مدل از پارامترهای مختلفی برای کنترل دقیقتر فرآیند تولید تصویر پشتیبانی میکند، از جمله تنظیم مقیاس CFG (Classifier Free Guidance) برای تعیین میزان تطابق تصویر با متن ورودی، تعیین سطح تحمل ایمنی برای فیلتر کردن محتوای نامناسب، انتخاب فرمت خروجی تصویر (JPEG یا PNG) و تعیین نسبت تصویر. همچنین، کاربران میتوانند تعداد تصاویر تولیدی و یک مقدار seed برای تکرارپذیری نتایج تعیین کنند. این مدل به ویژه برای کاربردهایی که نیاز به تولید سریع و با کیفیت تصاویر از متن دارند، مناسب است. با استفاده از API ارائه شده توسط ای ای کار (AI-KAR)، توسعهدهندگان میتوانند به راحتی این مدل را در برنامهها و سرویسهای خود ادغام کنند و از قابلیتهای آن بهرهمند شوند. این مدل با پشتیبانی از فرمتهای مختلف تصویر و امکان تنظیم پارامترهای گوناگون، انعطافپذیری بالایی را برای کاربران فراهم میکند. مدل flux-kontext-pro-text-to-image یک ابزار قدرتمند برای تولید تصاویر خلاقانه و کاربردی از متن است و میتواند در زمینههای مختلفی مانند طراحی گرافیک، تولید محتوا و آموزش مورد استفاده قرار گیرد. این مدل با ارائه نتایج با کیفیت و سرعت بالا، به کاربران کمک میکند تا ایدههای خود را به سرعت به تصاویر واقعی تبدیل کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت: flux/kontext-pro/text-to-image مقادیر مجاز (کلیک برای کپی): |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) که میزان تطابق تصویر با متن ورودی را تعیین میکند. حداقل مقدار 1 و حداکثر مقدار 20 است. |
safety_tolerance | string | سطح تحمل ایمنی برای تصویر تولید شده. 1 سختگیرانهترین و 5 آزادترین حالت است. مقدار پیشفرض: 2 مقادیر مجاز (کلیک برای کپی): |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض: jpeg مقادیر مجاز (کلیک برای کپی): |
aspect_ratio | string | نسبت تصویر تولید شده. مقدار پیشفرض: 16:9 مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن توصیفی که محتوا، سبک یا ترکیب تصویر را مشخص میکند. حداکثر طول: 4000 کاراکتر |
num_images | number | تعداد تصاویر تولیدی. حداقل مقدار 1 و حداکثر مقدار 4 است. مقدار پیشفرض: 1 |
seed | integer | مقدار seed برای تکرارپذیری نتایج. با استفاده از یک seed ثابت، با همان متن ورودی و مدل، همیشه یک تصویر یکسان تولید میشود. حداقل مقدار: 1 |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
"model": "flux/kontext-pro/text-to-image",
"aspect_ratio": "21:9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"images": [
{
"url": "#",
"width": 1568,
"height": 672,
"content_type": "image/jpeg"
}
],
"timings": {},
"seed": 2561481494,
"has_nsfw_concepts": [
false
],
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}