Image Modelsstability-ai
معرفی و مستندات مدل هوش مصنوعی stable-diffusion-v3-medium
مستندات مدل stable-diffusion-v3-medium ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، توصیه میشود از عبارات ساده و واضح استفاده کنید.
مدل stable-diffusion-v3-medium یک مدل پیشرفته تولید تصویر از متن است که از معماری Multimodal Diffusion Transformer (MMDiT) استفاده میکند. این مدل قادر است تصاویر با کیفیت بالا را از توضیحات متنی تولید کند. این مدل برای تولید تصاویر خلاقانه، طراحی مفهومی، و ایجاد محتوای بصری متنوع مناسب است. با استفاده از این مدل، کاربران میتوانند ایدههای خود را به تصاویر واقعی تبدیل کنند. این مدل قابلیت درک و تفسیر دستورات متنی پیچیده را دارد و میتواند تصاویر دقیقی را بر اساس این دستورات تولید کند. همچنین، این مدل از قابلیتهای پیشرفتهای برای کنترل سبک و ترکیببندی تصاویر برخوردار است. کاربران میتوانند با تنظیم پارامترهای مختلف، تصاویر دلخواه خود را با دقت بیشتری تولید کنند. این مدل در زمینههای مختلفی مانند هنر، تبلیغات، آموزش، و سرگرمی کاربرد دارد. با استفاده از این مدل، هنرمندان میتوانند آثار هنری جدیدی خلق کنند، شرکتها میتوانند تبلیغات جذابتری طراحی کنند، معلمان میتوانند محتوای آموزشی بصری تولید کنند، و افراد عادی میتوانند تصاویر سرگرمکنندهای ایجاد کنند. مدل stable-diffusion-v3-medium یک ابزار قدرتمند برای تولید تصاویر با کیفیت بالا از متن است که میتواند به کاربران در زمینههای مختلف کمک کند. این مدل با استفاده از تکنولوژیهای پیشرفته، امکانات گستردهای را برای تولید تصاویر خلاقانه و جذاب فراهم میکند. این مدل به طور خاص برای تولید تصاویر با جزئیات دقیق و رنگهای زنده طراحی شده است. کاربران میتوانند با استفاده از این مدل، تصاویری را تولید کنند که قبلاً تصور آن را هم نمیکردند. این مدل با قابلیتهای پیشرفتهای که دارد، میتواند به کاربران در رسیدن به اهداف خلاقانهشان کمک کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار این پارامتر باید `stable-diffusion-v3-medium` باشد. مقادیر مجاز (کلیک برای کپی): |
image_size | string | اندازه تصویر تولید شده. میتواند یک شیء شامل `height` و `width` باشد یا یکی از مقادیر از پیش تعیین شده. مقادیر مجاز (کلیک برای کپی): |
image_size | object | اندازه تصویر تولید شده. هم ارتفاع و هم عرض باید مضربی از 32 باشند. |
negative_prompt | string | توضیح عناصری که باید در تصویر تولید شده از آنها اجتناب شود. |
prompt_expansion | boolean | اگر مقدار آن `True` باشد، جزئیات بیشتری به متن ورودی اضافه میشود. |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به متن ورودی شما پایبند باشد. |
num_inference_steps | integer | تعداد مراحل استنتاج برای انجام. |
enable_safety_checker | boolean | اگر مقدار آن `True` باشد، بررسی کننده ایمنی فعال میشود. |
prompt | stringRequired | متن ورودی که محتوا، سبک یا ترکیب تصویر تولید شده را توصیف میکند. |
num_images | number | تعداد تصاویری که باید تولید شوند. |
seed | integer | با استفاده از یک seed ثابت و یک متن ورودی یکسان، همیشه یک تصویر یکسان تولید میشود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
"model": "stable-diffusion-v3-medium",
"image_size": "landscape_16_9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"images": [
{
"url": "#",
"width": 1024,
"height": 576,
"content_type": "image/jpeg"
}
],
"timings": {
"inference": 1.1477893170085736
},
"seed": 3544609846964942300,
"has_nsfw_concepts": [
false
],
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses. Realistic photo.",
"num_images": 1
}