Image Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی imagen-4-fast-generate

مستندات مدل تولید تصویر سریع imagen-4-fast-generate از گوگل، ارائه شده توسط ای ای کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، توصیه می‌شود از prompt های انگلیسی استفاده کنید.

مدل imagen-4-fast-generate یک مدل تولید تصویر است که توسط گوگل توسعه داده شده و برای سرعت بالا بهینه سازی شده است. این مدل در مقایسه با سایر مدل‌های Imagen 4 مانند Imagen 4 Generate 001 (استاندارد) و Imagen 4 Ultra Generate 001 (کیفیت بالاتر، سرعت کمتر)، تصاویر را با سرعت بیشتری تولید می‌کند. این مدل برای کاربردهایی که نیاز به تولید سریع تصاویر دارند، مانند پیش‌نمایش‌ها، نمونه‌سازی اولیه و تولید محتوای بصری در مقیاس بزرگ، بسیار مناسب است. با استفاده از این مدل، کاربران می‌توانند با ارائه یک متن توصیفی (prompt)، تصاویر مرتبط را به سرعت تولید کنند. این مدل از طریق API قابل دسترسی است و امکان تنظیم پارامترهای مختلفی مانند نسبت تصویر، تعداد تصاویر تولیدی، و سطح ایمنی را فراهم می‌کند. همچنین، این مدل از قابلیت ارتقاء کیفیت prompt با استفاده از یک مدل زبانی بزرگ (LLM) بهره می‌برد که می‌تواند به تولید تصاویر با کیفیت بالاتر و تطابق بهتر با prompt اصلی کمک کند. این قابلیت به صورت پیش‌فرض فعال است، اما کاربران می‌توانند آن را غیرفعال کنند. مدل imagen-4-fast-generate با هدف ارائه یک راه حل سریع و کارآمد برای تولید تصاویر با کیفیت مناسب طراحی شده است و می‌تواند به عنوان یک ابزار قدرتمند در اختیار توسعه‌دهندگان، طراحان و تولیدکنندگان محتوا قرار گیرد. این مدل با ارائه سرعت بالا و قابلیت تنظیم پارامترها، امکان تولید تصاویر متنوع و متناسب با نیازهای مختلف را فراهم می‌کند. همچنین، با استفاده از قابلیت ارتقاء کیفیت prompt، کاربران می‌توانند تصاویر با کیفیت بالاتر و تطابق بهتر با prompt اصلی تولید کنند. این مدل یک انتخاب عالی برای کاربرانی است که به دنبال یک راه حل سریع و کارآمد برای تولید تصاویر هستند. این مدل در پلتفرم ای ای کار (AI-KAR) در دسترس است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت: google/imagen-4.0-fast-generate-001
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص می‌کند. حداکثر طول: 400 کاراکتر.
convert_base64_to_url
boolean
اگر True باشد، URL تصویر بازگردانده می‌شود. در غیر این صورت، فایل به صورت base64 ارائه می‌شود. مقدار پیش‌فرض: true
num_images
integer
تعداد تصاویری که باید تولید شوند. حداکثر: 4. مقدار پیش‌فرض: 1
seed
integer
با استفاده از یک seed ثابت و یک prompt یکسان، مدل همیشه یک تصویر یکسان تولید می‌کند. حداکثر: 4294967295
enhance_prompt
boolean
پارامتر اختیاری برای استفاده از قابلیت بازنویسی prompt مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با prompt اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و هم ترازی prompt تأثیر بگذارد. مقدار پیش‌فرض: true
aspect_ratio
string
نسبت تصویر تولید شده. مقدار پیش‌فرض: 1:1
مقادیر مجاز (کلیک برای کپی):
person_generation
string
اجازه تولید تصاویر شامل افراد. مقدار پیش‌فرض: allow_adult
مقادیر مجاز (کلیک برای کپی):
safety_setting
string
سطح فیلتر ایمنی را اضافه می‌کند. مقدار پیش‌فرض: block_medium_and_above
مقادیر مجاز (کلیک برای کپی):
add_watermark
boolean
اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیش‌فرض: false

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json   # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Racoon eating ice-cream",
            "model": "google/imagen-4.0-fast-generate-001",
            "aspect_ratio": "16:9"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "mime_type": "image/png",
      "url": "#",
      "prompt": "A raccoon, with a mischievous grin, holds a melting cone of mint chocolate chip ice cream in its front paws, enjoying a warm summer day in a picturesque park. The sunlight creates a gentle, golden glow around the raccoon, illuminating the soft, fluffy fur. The cone is dripping with ice cream, creating a scene of playful chaos. A detailed, high-quality photo with a shallow depth of field, blurring the background foliage, creating a soft and dreamy aesthetic. The vibrant green trees and lush grass provide a beautiful and tranquil setting for the raccoon's treat."
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 42000
    }
  }
}