Image Modelsstability-ai

معرفی و مستندات مدل هوش مصنوعی stable-diffusion-v3-medium

مستندات مدل stable-diffusion-v3-medium ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از عبارات ساده و واضح استفاده کنید.

مدل stable-diffusion-v3-medium یک مدل پیشرفته تولید تصویر از متن است که از معماری Multimodal Diffusion Transformer (MMDiT) استفاده می‌کند. این مدل قادر است تصاویر با کیفیت بالا را از توضیحات متنی تولید کند. این مدل برای تولید تصاویر خلاقانه، طراحی مفهومی، و ایجاد محتوای بصری متنوع مناسب است. با استفاده از این مدل، کاربران می‌توانند ایده‌های خود را به تصاویر واقعی تبدیل کنند. این مدل قابلیت درک و تفسیر دستورات متنی پیچیده را دارد و می‌تواند تصاویر دقیقی را بر اساس این دستورات تولید کند. همچنین، این مدل از قابلیت‌های پیشرفته‌ای برای کنترل سبک و ترکیب‌بندی تصاویر برخوردار است. کاربران می‌توانند با تنظیم پارامترهای مختلف، تصاویر دلخواه خود را با دقت بیشتری تولید کنند. این مدل در زمینه‌های مختلفی مانند هنر، تبلیغات، آموزش، و سرگرمی کاربرد دارد. با استفاده از این مدل، هنرمندان می‌توانند آثار هنری جدیدی خلق کنند، شرکت‌ها می‌توانند تبلیغات جذاب‌تری طراحی کنند، معلمان می‌توانند محتوای آموزشی بصری تولید کنند، و افراد عادی می‌توانند تصاویر سرگرم‌کننده‌ای ایجاد کنند. مدل stable-diffusion-v3-medium یک ابزار قدرتمند برای تولید تصاویر با کیفیت بالا از متن است که می‌تواند به کاربران در زمینه‌های مختلف کمک کند. این مدل با استفاده از تکنولوژی‌های پیشرفته، امکانات گسترده‌ای را برای تولید تصاویر خلاقانه و جذاب فراهم می‌کند. این مدل به طور خاص برای تولید تصاویر با جزئیات دقیق و رنگ‌های زنده طراحی شده است. کاربران می‌توانند با استفاده از این مدل، تصاویری را تولید کنند که قبلاً تصور آن را هم نمی‌کردند. این مدل با قابلیت‌های پیشرفته‌ای که دارد، می‌تواند به کاربران در رسیدن به اهداف خلاقانه‌شان کمک کند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار این پارامتر باید `stable-diffusion-v3-medium` باشد. مقادیر مجاز (کلیک برای کپی):
image_size	string	اندازه تصویر تولید شده. می‌تواند یک شیء شامل `height` و `width` باشد یا یکی از مقادیر از پیش تعیین شده. مقادیر مجاز (کلیک برای کپی):
image_size	object	اندازه تصویر تولید شده. هم ارتفاع و هم عرض باید مضربی از 32 باشند.
negative_prompt	string	توضیح عناصری که باید در تصویر تولید شده از آنها اجتناب شود.
prompt_expansion	boolean	اگر مقدار آن `True` باشد، جزئیات بیشتری به متن ورودی اضافه می‌شود.
guidance_scale	number	مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به متن ورودی شما پایبند باشد.
num_inference_steps	integer	تعداد مراحل استنتاج برای انجام.
enable_safety_checker	boolean	اگر مقدار آن `True` باشد، بررسی کننده ایمنی فعال می‌شود.
prompt	stringRequired	متن ورودی که محتوا، سبک یا ترکیب تصویر تولید شده را توصیف می‌کند.
num_images	number	تعداد تصاویری که باید تولید شوند.
seed	integer	با استفاده از یک seed ثابت و یک متن ورودی یکسان، همیشه یک تصویر یکسان تولید می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "stable-diffusion-v3-medium",
            "image_size": "landscape_16_9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "images": [
    {
      "url": "#",
      "width": 1024,
      "height": 576,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {
    "inference": 1.1477893170085736
  },
  "seed": 3544609846964942300,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses. Realistic photo.",
  "num_images": 1
}