Image Modelstencent
معرفی و مستندات مدل هوش مصنوعی hunyuan-image-v3-text-to-image
مستندات مدل تولید تصویر hunyuan-image-v3-text-to-image، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای نتایج بهتر، استفاده از prompt های انگلیسی توصیه میشود.
مدل hunyuan-image-v3-text-to-image یک مدل پیشرفته تولید تصویر است که توسط Tencent توسعه داده شده است. این مدل به شما امکان میدهد تا با استفاده از توضیحات متنی (prompt)، تصاویر بصری جذاب و با کیفیت بالا ایجاد کنید. این مدل با درک عمیق از زبان طبیعی، قادر است تا مفاهیم پیچیده را به تصاویر واقعی و هنری تبدیل کند. از این مدل میتوان برای تولید تصاویر متنوعی استفاده کرد، از جمله تصاویر واقعگرایانه، تصاویر هنری، تصاویر کارتونی و غیره. این مدل برای کاربردهای مختلفی مناسب است، از جمله تولید محتوای بصری برای وبسایتها، شبکههای اجتماعی، تبلیغات، بازیها و غیره. همچنین، این مدل میتواند به عنوان یک ابزار خلاقانه برای هنرمندان، طراحان و سایر افراد خلاق مورد استفاده قرار گیرد. با استفاده از این مدل، میتوانید به راحتی ایدههای خود را به تصاویر بصری تبدیل کنید و محتوای جذاب و منحصر به فردی ایجاد کنید. این مدل از پارامترهای مختلفی برای کنترل فرآیند تولید تصویر پشتیبانی میکند، از جمله اندازه تصویر، تعداد مراحل استنتاج، مقیاس راهنمایی و غیره. این پارامترها به شما امکان میدهند تا تصاویر تولید شده را به دقت تنظیم کنید و به نتایج دلخواه خود برسید. مدل hunyuan-image-v3-text-to-image یک ابزار قدرتمند و انعطافپذیر است که میتواند به شما در تولید تصاویر بصری با کیفیت بالا کمک کند. این مدل به طور مداوم در حال بهبود است و ویژگیهای جدیدی به آن اضافه میشود. با استفاده از این مدل، میتوانید از آخرین پیشرفتها در زمینه تولید تصویر با هوش مصنوعی بهرهمند شوید. این مدل با استفاده از تکنیکهای پیشرفته یادگیری عمیق آموزش داده شده است و قادر است تا تصاویر با جزئیات بالا و رنگهای زنده تولید کند. همچنین، این مدل از قابلیتهای مختلفی برای بهبود کیفیت تصاویر تولید شده پشتیبانی میکند، از جمله حذف نویز، افزایش وضوح و غیره. با استفاده از این مدل، میتوانید تصاویری تولید کنید که از نظر کیفیت با تصاویر تولید شده توسط انسان قابل مقایسه هستند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت: hunyuan/hunyuan-image-v3-text-to-image مقادیر مجاز (کلیک برای کپی): |
negative_prompt | string | توضیح عناصری که باید در تصویر تولید شده از آنها اجتناب شود. |
image_size | string | اندازه تصویر تولید شده. مقادیر مجاز (کلیک برای کپی): |
num_inference_steps | integer | تعداد مراحل استنتاج برای انجام. حداقل: 1، حداکثر: 50. |
guidance_scale | number | مقیاس CFG (Classifier Free Guidance) معیاری است برای اینکه مدل چقدر به درخواست شما پایبند باشد. |
enable_safety_checker | boolean | اگر روی True تنظیم شود، بررسی کننده ایمنی فعال خواهد شد. |
sync_mode | boolean | اگر روی true تنظیم شود، تابع منتظر میماند تا تصویر تولید و بارگذاری شود قبل از اینکه پاسخ را برگرداند. |
output_format | string | فرمت تصویر تولید شده. مقادیر مجاز (کلیک برای کپی): |
enable_prompt_expansion | boolean | اگر روی True تنظیم شود، prompt با جزئیات بیشتر upsampled میشود. |
prompt | stringRequired | متن توصیفی محتوا، سبک یا ترکیب تصویر برای تولید. حداکثر: 4000 کاراکتر. |
num_images | number | تعداد تصاویری که باید تولید شوند. حداقل: 1، حداکثر: 4. |
seed | integer | همان seed و همان prompt داده شده به همان نسخه از مدل، هر بار یک تصویر یکسان را خروجی میدهد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
"model": "hunyuan/hunyuan-image-v3-text-to-image",
"image_size": "landscape_16_9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"content_type": "image/png",
"file_name": null,
"file_size": null,
"width": 1280,
"height": 768
}
],
"meta": {
"usage": {
"tokens_used": 210000
}
}
}