Image Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی imagen-4-ultra
مستندات مدل imagen-4-ultra از گوگل، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، توصیه میشود از promptهای انگلیسی استفاده کنید.
مدل imagen-4-ultra، جدیدترین و با کیفیتترین مدل تولید تصویر گوگل تا جولای 2025 است. این مدل با بهرهگیری از پیشرفتهترین تکنیکهای هوش مصنوعی، قادر است تصاویر بسیار واقعگرایانه و با جزئیات بالا را از روی متن تولید کند. یکی از ویژگیهای برجسته این مدل، پشتیبانی از بهبود خودکار promptهای ورودی است. به این ترتیب، حتی اگر prompt ورودی شما خیلی دقیق و کامل نباشد، مدل میتواند آن را به طور خودکار بهبود بخشیده و تصویری با کیفیت و مطابق با خواستههای شما تولید کند. همچنین، imagen-4-ultra از سیستم پیشگزینش محتوای تولید شده بهره میبرد که از تولید تصاویر نامناسب و غیراخلاقی جلوگیری میکند. این ویژگی به ویژه برای استفادههای تجاری و عمومی بسیار مهم است. مدل imagen-4-ultra درک بسیار خوبی از مفاهیم و ارتباطات بین اشیاء دارد و میتواند تصاویر پیچیده و چندلایه را با دقت بالا تولید کند. این مدل قادر است سبکهای هنری مختلف را تقلید کند و تصاویری با سبکهای نقاشی، عکاسی، طراحی سهبعدی و غیره تولید کند. همچنین، imagen-4-ultra از پارامترهای مختلفی برای کنترل ویژگیهای تصویر تولید شده پشتیبانی میکند. شما میتوانید پارامترهایی مانند نسبت تصویر، تعداد تصاویر تولید شده، seed (برای تولید تصاویر تکرارپذیر)، فعال یا غیرفعال کردن بهبود prompt، و سطح فیلتر ایمنی را تنظیم کنید. این امکان به شما میدهد تا کنترل کاملی بر روی فرایند تولید تصویر داشته باشید و تصاویری دقیقاً مطابق با نیازهای خود تولید کنید. با استفاده از API ارائه شده توسط ای آی کار (AI-KAR)، میتوانید به راحتی از این مدل در برنامهها و پروژههای خود استفاده کنید. API این مدل بسیار ساده و قابل فهم است و به شما امکان میدهد تا با کمترین دانش فنی، تصاویر با کیفیت بالا تولید کنید. مدل imagen-4-ultra یک ابزار قدرتمند برای تولید تصاویر خلاقانه و نوآورانه است و میتواند در زمینههای مختلفی مانند تبلیغات، بازاریابی، طراحی، آموزش و سرگرمی مورد استفاده قرار گیرد. این مدل به شما کمک میکند تا ایدههای خود را به سرعت و به آسانی به تصاویر واقعی تبدیل کنید و محتوای بصری جذاب و با کیفیتی تولید کنید.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار این پارامتر باید 'imagen-4.0-ultra-generate-preview-06-06' باشد. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف میکند. حداکثر طول: 400 کاراکتر. |
convert_base64_to_url | boolean | اگر مقدار این پارامتر True باشد، URL تصویر بازگردانده میشود. در غیر این صورت، فایل به صورت base64 ارائه میشود. مقدار پیشفرض: true. |
num_images | integer | تعداد تصاویری که باید تولید شوند. حداکثر مقدار: 4. مقدار پیشفرض: 1. |
seed | integer | با استفاده از یک seed مشخص و یکسان، و با همان prompt و نسخه مدل، همیشه یک تصویر یکسان تولید میشود. حداکثر مقدار: 4294967295. |
enhance_prompt | boolean | پارامتر اختیاری برای استفاده از ویژگی بازنویسی prompt مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با prompt اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و همسویی prompt تأثیر بگذارد. مقدار پیشفرض: true. |
aspect_ratio | string | نسبت تصویر تولید شده. مقدار پیشفرض: 1:1. مقادیر مجاز (کلیک برای کپی): |
person_generation | string | اجازه تولید تصاویر شامل افراد. مقدار پیشفرض: allow_adult. مقادیر مجاز (کلیک برای کپی): |
safety_setting | string | اضافه کردن سطح فیلتر به فیلتر ایمنی. مقدار پیشفرض: block_medium_and_above. مقادیر مجاز (کلیک برای کپی): |
add_watermark | boolean | اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیشفرض: false. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "Racoon eating ice-cream",
"model": "imagen-4.0-ultra-generate-preview-06-06",
"aspect_ratio": "16:9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"mime_type": "image/png",
"url": "#",
"prompt": "A curious raccoon is sitting upright on a weathered wooden picnic table, intensely focused on eating a melting ice cream cone. The raccoon holds the cone delicately in its paws, with sticky ice cream smeared around its mouth and on its fur. The ice cream is a vibrant strawberry pink color, dripping down the cone onto the table surface. Its mask-like facial markings are prominent, and its dark eyes are wide with concentration. The setting is a lush green park during golden hour, with soft, warm sunlight filtering through the background trees, creating a gentle bokeh effect. Empty picnic benches are visible in the soft-focus background. The wooden table is slightly worn, with visible grain and a few scattered leaves. The lighting is natural and warm, highlighting the raccoon's fur and the glistening ice cream."
}
]
}