Image Modelsstability-ai

معرفی و مستندات مدل هوش مصنوعی stable-diffusion-v35-large

مستندات مدل stable-diffusion-v35-large ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از عبارات ساده و واضح استفاده کنید.

مدل stable-diffusion-v35-large یک مدل تولید تصویر از متن پیشرفته است که توسط Stability AI توسعه داده شده است. این مدل قادر است تصاویر با رزولوشن بالا و کیفیت متنوعی را بر اساس توضیحات متنی تولید کند. این مدل برای کاربردهای حرفه‌ای طراحی شده و می‌تواند در زمینه‌های مختلفی مانند طراحی گرافیک، تولید محتوا، هنر دیجیتال و غیره مورد استفاده قرار گیرد. stable-diffusion-v35-large با استفاده از تکنیک‌های یادگیری عمیق پیشرفته، قادر است تصاویر واقع‌گرایانه، هنری و خلاقانه‌ای را تولید کند که با دقت بالایی به توضیحات متنی ارائه شده مطابقت دارند. این مدل از معماری شبکه‌های عصبی پیچیده بهره می‌برد که به آن امکان می‌دهد الگوها و ارتباطات پیچیده بین متن و تصویر را درک کند. یکی از ویژگی‌های برجسته این مدل، توانایی آن در تولید تصاویر با جزئیات دقیق و بافت‌های واقع‌گرایانه است. این مدل می‌تواند عناصری مانند نورپردازی، سایه‌ها، رنگ‌ها و بافت‌ها را به طور خودکار در تصاویر تولید شده اعمال کند، که منجر به ایجاد تصاویری با کیفیت بالا و جذاب می‌شود. علاوه بر این، stable-diffusion-v35-large از قابلیت‌های پیشرفته‌ای برای کنترل سبک و ترکیب‌بندی تصاویر تولید شده برخوردار است. کاربران می‌توانند با استفاده از پارامترهای مختلف، سبک هنری، زاویه دید، عمق میدان و سایر جنبه‌های بصری تصاویر را تنظیم کنند. این امکان به کاربران اجازه می‌دهد تا تصاویر دقیقی را مطابق با نیازها و سلیقه‌های خود تولید کنند. این مدل همچنین از قابلیت تولید تصاویر متنوع با موضوعات مختلف پشتیبانی می‌کند. کاربران می‌توانند از این مدل برای تولید تصاویر از مناظر طبیعی، پرتره‌ها، اشیاء، حیوانات و غیره استفاده کنند. stable-diffusion-v35-large با ارائه یک رابط کاربری ساده و قابل فهم، به کاربران امکان می‌دهد تا به راحتی توضیحات متنی خود را وارد کرده و تصاویر مورد نظر خود را تولید کنند. این مدل همچنین از APIهای مختلفی پشتیبانی می‌کند که به توسعه‌دهندگان امکان می‌دهد آن را در برنامه‌ها و سرویس‌های خود ادغام کنند. در مجموع، stable-diffusion-v35-large یک ابزار قدرتمند و کارآمد برای تولید تصاویر از متن است که می‌تواند در زمینه‌های مختلفی مورد استفاده قرار گیرد. این مدل با ارائه کیفیت بالا، تنوع و قابلیت کنترل، به کاربران امکان می‌دهد تا تصاویر خلاقانه و جذابی را تولید کنند. این مدل با استفاده از تکنولوژی روز دنیا ساخته شده است و توسط تیم ای آی کار (AI-KAR) در دسترس شما قرار گرفته است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار این پارامتر باید `stable-diffusion-v35-large` باشد.
مقادیر مجاز (کلیک برای کپی):
image_size
any of
اندازه تصویر تولید شده. می‌تواند یک شیء با مشخص کردن ارتفاع و عرض باشد (هر دو باید مضربی از 32 باشند) یا یک رشته از مقادیر enum.
image_size
string
اندازه تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
negative_prompt
string
توضیح عناصری که باید در تصویر تولید شده از آنها اجتناب شود.
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد.
num_inference_steps
integer
تعداد مراحل استنتاج برای انجام.
enable_safety_checker
boolean
اگر روی True تنظیم شود، بررسی‌کننده ایمنی فعال خواهد شد.
prompt
stringRequired
توضیح متنی محتوا، سبک یا ترکیب‌بندی تصویری که باید تولید شود.
num_images
number
تعداد تصاویری که باید تولید شوند.
seed
integer
همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را تولید می‌کند.
output_format
string
فرمت تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "stable-diffusion-v35-large",
            "image_size": "landscape_16_9",
            "num_inference_steps": 40,
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "images": [
    {
      "url": "#",
      "width": 1024,
      "height": 576,
      "content_type": "image/jpeg"
    }
  ],
  "timings": {
    "inference": 4.855678029009141
  },
  "seed": 6199662706750842000,
  "has_nsfw_concepts": [
    false
  ],
  "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}