Image Modelstencent

معرفی و مستندات مدل هوش مصنوعی hunyuan-image-v3-text-to-image

مستندات مدل تولید تصویر hunyuan-image-v3-text-to-image، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، استفاده از prompt های انگلیسی توصیه می‌شود.

مدل hunyuan-image-v3-text-to-image یک مدل پیشرفته تولید تصویر است که توسط Tencent توسعه داده شده است. این مدل به شما امکان می‌دهد تا با استفاده از توضیحات متنی (prompt)، تصاویر بصری جذاب و با کیفیت بالا ایجاد کنید. این مدل با درک عمیق از زبان طبیعی، قادر است تا مفاهیم پیچیده را به تصاویر واقعی و هنری تبدیل کند. از این مدل می‌توان برای تولید تصاویر متنوعی استفاده کرد، از جمله تصاویر واقع‌گرایانه، تصاویر هنری، تصاویر کارتونی و غیره. این مدل برای کاربردهای مختلفی مناسب است، از جمله تولید محتوای بصری برای وب‌سایت‌ها، شبکه‌های اجتماعی، تبلیغات، بازی‌ها و غیره. همچنین، این مدل می‌تواند به عنوان یک ابزار خلاقانه برای هنرمندان، طراحان و سایر افراد خلاق مورد استفاده قرار گیرد. با استفاده از این مدل، می‌توانید به راحتی ایده‌های خود را به تصاویر بصری تبدیل کنید و محتوای جذاب و منحصر به فردی ایجاد کنید. این مدل از پارامترهای مختلفی برای کنترل فرآیند تولید تصویر پشتیبانی می‌کند، از جمله اندازه تصویر، تعداد مراحل استنتاج، مقیاس راهنمایی و غیره. این پارامترها به شما امکان می‌دهند تا تصاویر تولید شده را به دقت تنظیم کنید و به نتایج دلخواه خود برسید. مدل hunyuan-image-v3-text-to-image یک ابزار قدرتمند و انعطاف‌پذیر است که می‌تواند به شما در تولید تصاویر بصری با کیفیت بالا کمک کند. این مدل به طور مداوم در حال بهبود است و ویژگی‌های جدیدی به آن اضافه می‌شود. با استفاده از این مدل، می‌توانید از آخرین پیشرفت‌ها در زمینه تولید تصویر با هوش مصنوعی بهره‌مند شوید. این مدل با استفاده از تکنیک‌های پیشرفته یادگیری عمیق آموزش داده شده است و قادر است تا تصاویر با جزئیات بالا و رنگ‌های زنده تولید کند. همچنین، این مدل از قابلیت‌های مختلفی برای بهبود کیفیت تصاویر تولید شده پشتیبانی می‌کند، از جمله حذف نویز، افزایش وضوح و غیره. با استفاده از این مدل، می‌توانید تصاویری تولید کنید که از نظر کیفیت با تصاویر تولید شده توسط انسان قابل مقایسه هستند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت: hunyuan/hunyuan-image-v3-text-to-image
مقادیر مجاز (کلیک برای کپی):
negative_prompt
string
توضیح عناصری که باید در تصویر تولید شده از آنها اجتناب شود.
image_size
string
اندازه تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
num_inference_steps
integer
تعداد مراحل استنتاج برای انجام. حداقل: 1، حداکثر: 50.
guidance_scale
number
مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد.
enable_safety_checker
boolean
اگر روی True تنظیم شود، بررسی کننده ایمنی فعال خواهد شد.
sync_mode
boolean
اگر روی true تنظیم شود، تابع منتظر می‌ماند تا تصویر تولید و بارگذاری شود قبل از اینکه پاسخ را برگرداند.
output_format
string
فرمت تصویر تولید شده.
مقادیر مجاز (کلیک برای کپی):
enable_prompt_expansion
boolean
اگر روی True تنظیم شود، prompt با جزئیات بیشتر upsampled می‌شود.
prompt
stringRequired
متن توصیفی محتوا، سبک یا ترکیب تصویر برای تولید. حداکثر: 4000 کاراکتر.
num_images
number
تعداد تصاویری که باید تولید شوند. حداقل: 1، حداکثر: 4.
seed
integer
همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را خروجی می‌دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "hunyuan/hunyuan-image-v3-text-to-image",
            "image_size": "landscape_16_9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "content_type": "image/png",
      "file_name": null,
      "file_size": null,
      "width": 1280,
      "height": 768
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 210000
    }
  }
}