Image Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی imagen-4-ultra

مستندات مدل imagen-4-ultra از گوگل، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از promptهای انگلیسی استفاده کنید.

مدل imagen-4-ultra، جدیدترین و با کیفیت‌ترین مدل تولید تصویر گوگل تا جولای 2025 است. این مدل با بهره‌گیری از پیشرفته‌ترین تکنیک‌های هوش مصنوعی، قادر است تصاویر بسیار واقع‌گرایانه و با جزئیات بالا را از روی متن تولید کند. یکی از ویژگی‌های برجسته این مدل، پشتیبانی از بهبود خودکار promptهای ورودی است. به این ترتیب، حتی اگر prompt ورودی شما خیلی دقیق و کامل نباشد، مدل می‌تواند آن را به طور خودکار بهبود بخشیده و تصویری با کیفیت و مطابق با خواسته‌های شما تولید کند. همچنین، imagen-4-ultra از سیستم پیش‌گزینش محتوای تولید شده بهره می‌برد که از تولید تصاویر نامناسب و غیراخلاقی جلوگیری می‌کند. این ویژگی به ویژه برای استفاده‌های تجاری و عمومی بسیار مهم است. مدل imagen-4-ultra درک بسیار خوبی از مفاهیم و ارتباطات بین اشیاء دارد و می‌تواند تصاویر پیچیده و چندلایه را با دقت بالا تولید کند. این مدل قادر است سبک‌های هنری مختلف را تقلید کند و تصاویری با سبک‌های نقاشی، عکاسی، طراحی سه‌بعدی و غیره تولید کند. همچنین، imagen-4-ultra از پارامترهای مختلفی برای کنترل ویژگی‌های تصویر تولید شده پشتیبانی می‌کند. شما می‌توانید پارامترهایی مانند نسبت تصویر، تعداد تصاویر تولید شده، seed (برای تولید تصاویر تکرارپذیر)، فعال یا غیرفعال کردن بهبود prompt، و سطح فیلتر ایمنی را تنظیم کنید. این امکان به شما می‌دهد تا کنترل کاملی بر روی فرایند تولید تصویر داشته باشید و تصاویری دقیقاً مطابق با نیازهای خود تولید کنید. با استفاده از API ارائه شده توسط ای آی کار (AI-KAR)، می‌توانید به راحتی از این مدل در برنامه‌ها و پروژه‌های خود استفاده کنید. API این مدل بسیار ساده و قابل فهم است و به شما امکان می‌دهد تا با کمترین دانش فنی، تصاویر با کیفیت بالا تولید کنید. مدل imagen-4-ultra یک ابزار قدرتمند برای تولید تصاویر خلاقانه و نوآورانه است و می‌تواند در زمینه‌های مختلفی مانند تبلیغات، بازاریابی، طراحی، آموزش و سرگرمی مورد استفاده قرار گیرد. این مدل به شما کمک می‌کند تا ایده‌های خود را به سرعت و به آسانی به تصاویر واقعی تبدیل کنید و محتوای بصری جذاب و با کیفیتی تولید کنید.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار این پارامتر باید 'imagen-4.0-ultra-generate-preview-06-06' باشد.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند. حداکثر طول: 400 کاراکتر.
convert_base64_to_url
boolean
اگر مقدار این پارامتر True باشد، URL تصویر بازگردانده می‌شود. در غیر این صورت، فایل به صورت base64 ارائه می‌شود. مقدار پیش‌فرض: true.
num_images
integer
تعداد تصاویری که باید تولید شوند. حداکثر مقدار: 4. مقدار پیش‌فرض: 1.
seed
integer
با استفاده از یک seed مشخص و یکسان، و با همان prompt و نسخه مدل، همیشه یک تصویر یکسان تولید می‌شود. حداکثر مقدار: 4294967295.
enhance_prompt
boolean
پارامتر اختیاری برای استفاده از ویژگی بازنویسی prompt مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با prompt اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و همسویی prompt تأثیر بگذارد. مقدار پیش‌فرض: true.
aspect_ratio
string
نسبت تصویر تولید شده. مقدار پیش‌فرض: 1:1.
مقادیر مجاز (کلیک برای کپی):
person_generation
string
اجازه تولید تصاویر شامل افراد. مقدار پیش‌فرض: allow_adult.
مقادیر مجاز (کلیک برای کپی):
safety_setting
string
اضافه کردن سطح فیلتر به فیلتر ایمنی. مقدار پیش‌فرض: block_medium_and_above.
مقادیر مجاز (کلیک برای کپی):
add_watermark
boolean
اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیش‌فرض: false.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json   # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Racoon eating ice-cream",
            "model": "imagen-4.0-ultra-generate-preview-06-06",
            "aspect_ratio": "16:9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "mime_type": "image/png",
      "url": "#",
      "prompt": "A curious raccoon is sitting upright on a weathered wooden picnic table, intensely focused on eating a melting ice cream cone. The raccoon holds the cone delicately in its paws, with sticky ice cream smeared around its mouth and on its fur. The ice cream is a vibrant strawberry pink color, dripping down the cone onto the table surface. Its mask-like facial markings are prominent, and its dark eyes are wide with concentration. The setting is a lush green park during golden hour, with soft, warm sunlight filtering through the background trees, creating a gentle bokeh effect. Empty picnic benches are visible in the soft-focus background. The wooden table is slightly worn, with visible grain and a few scattered leaves. The lighting is natural and warm, highlighting the raccoon's fur and the glistening ice cream."
    }
  ]
}