Image Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی imagen-4-ultra-generate

مستندات مدل تولید تصویر imagen-4-ultra-generate از گوگل، ارائه شده توسط ای ای کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، استفاده از دستورات انگلیسی توصیه می‌شود.

مدل imagen-4-ultra-generate یک مدل پیشرفته تولید تصویر است که توسط گوگل توسعه داده شده و برای تولید تصاویر فوتورئالیستی و رندر دقیق متن طراحی شده است. این مدل به طور خاص برای استفاده‌های حرفه‌ای با کیفیت بالا مناسب است. با استفاده از این مدل، کاربران می‌توانند تصاویری با جزئیات بسیار بالا و کیفیت بصری فوق‌العاده ایجاد کنند. این مدل قادر است تا دستورات متنی پیچیده را درک کرده و تصاویری مطابق با توضیحات ارائه شده تولید کند. یکی از ویژگی‌های برجسته این مدل، توانایی آن در رندر دقیق متن در تصاویر است که آن را برای کاربردهایی مانند تولید پوستر، تبلیغات و محتوای بصری با متن مناسب می‌سازد. این مدل از طریق API قابل دسترسی است و کاربران می‌توانند با ارسال درخواست‌های JSON، تصاویر مورد نظر خود را تولید کنند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در دسترس هستند، از جمله تعیین نسبت تصویر، تعداد تصاویر تولیدی، و سطح ایمنی. همچنین، کاربران می‌توانند از یک seed مشخص برای تولید تصاویر تکرارپذیر استفاده کنند. این مدل از قابلیت enhance_prompt نیز بهره می‌برد که با استفاده از یک مدل زبانی بزرگ (LLM)، دستورات متنی را بازنویسی کرده و کیفیت تصاویر تولیدی را بهبود می‌بخشد. با این حال، غیرفعال کردن این قابلیت ممکن است بر کیفیت تصویر و تطابق آن با دستور اصلی تأثیر بگذارد. مدل imagen-4-ultra-generate به کاربران امکان می‌دهد تا تصاویری با کیفیت بالا و مطابق با نیازهای خاص خود ایجاد کنند. این مدل با ارائه پارامترهای کنترلی متنوع و قابلیت‌های پیشرفته، ابزاری قدرتمند برای تولید محتوای بصری حرفه‌ای است. این مدل در ای ای کار (AI-KAR) در دسترس است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت `google/imagen-4.0-ultra-generate-001` را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
دستور متنی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند. حداکثر طول: 400 کاراکتر.
convert_base64_to_url
boolean
اگر `True` باشد، URL تصویر بازگردانده می‌شود. در غیر این صورت، فایل به صورت base64 ارائه می‌شود. مقدار پیش‌فرض: `true`.
num_images
integer
تعداد تصاویر تولیدی. حداکثر: 4. مقدار پیش‌فرض: 1.
seed
integer
یک seed مشخص برای تولید تصاویر تکرارپذیر. با استفاده از یک seed یکسان و دستور یکسان، یک نسخه یکسان از مدل، هر بار یک تصویر یکسان تولید می‌کند. حداکثر: 4294967295.
enhance_prompt
boolean
پارامتر اختیاری برای استفاده از ویژگی بازنویسی دستور مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با دستور اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و هم ترازی دستور تأثیر بگذارد. مقدار پیش‌فرض: `true`.
aspect_ratio
string
نسبت تصویر تولیدی. مقدار پیش‌فرض: `1:1`.
مقادیر مجاز (کلیک برای کپی):
person_generation
string
اجازه تولید تصاویر شامل افراد. مقدار پیش‌فرض: `allow_adult`.
مقادیر مجاز (کلیک برای کپی):
safety_setting
string
سطح فیلتر ایمنی را اضافه می‌کند. مقدار پیش‌فرض: `block_medium_and_above`.
مقادیر مجاز (کلیک برای کپی):
add_watermark
boolean
اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیش‌فرض: `false`.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Racoon eating ice-cream",
            "model": "google/imagen-4.0-ultra-generate-001",
            "aspect_ratio": "16:9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "mime_type": "image/png",
      "url": "#",
      "prompt": "A curious raccoon sitting upright on a park bench, intently focused on licking a melting scoop of vanilla ice cream in a waffle cone. The raccoon has its small paws wrapped around the cone, and a tiny bit of ice cream is smeared on its nose and whiskers. The fur is ruffled and slightly damp from the treat. The park setting is sunny with dappled light filtering through the leaves of a large oak tree in the background. Autumn leaves are scattered on the ground near the bench. The ice cream is dripping slightly down the cone, and a small puddle is forming on the wooden bench. The image is captured at eye level with the raccoon."
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 126000
    }
  }
}