Image Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی imagen-3.0

مستندات مدل تولید تصویر imagen-3.0 از گوگل، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه می‌شود.

مدل imagen-3.0 جدیدترین مدل هوش مصنوعی گوگل برای تولید تصویر از متن است. این مدل با هدف تولید تصاویر فوتورئالیستی با کیفیت بالا از توضیحات متنی طراحی شده است و در مقایسه با مدل‌های قبلی، جزئیات بیشتر، نورپردازی بهتر و مصنوعات کمتری دارد. Imagen-3.0 از درک پیشرفته‌تری از زبان طبیعی برخوردار است و می‌تواند متن را به شکل بهتری در تصاویر رندر کند. این مدل قادر است تصاویر متنوعی را با سبک‌ها و ترکیب‌بندی‌های مختلف ایجاد کند و به کاربران امکان می‌دهد تا ایده‌های خود را به صورت بصری به واقعیت تبدیل کنند. با استفاده از Imagen-3.0، کاربران می‌توانند تصاویری با جزئیات دقیق، رنگ‌های زنده و بافت‌های واقعی ایجاد کنند که قبلاً دستیابی به آن‌ها بسیار دشوار بود. این مدل به ویژه برای کاربردهایی مانند طراحی گرافیک، تولید محتوا، تبلیغات و هنر دیجیتال مناسب است. Imagen-3.0 با بهره‌گیری از الگوریتم‌های پیشرفته یادگیری عمیق، قادر است تصاویر را با سرعت بالا و کیفیت بی‌نظیر تولید کند. این مدل همچنین دارای قابلیت‌های ویرایش تصویر است که به کاربران امکان می‌دهد تا تصاویر تولید شده را به دلخواه خود تغییر دهند و بهبود بخشند. Imagen-3.0 یک ابزار قدرتمند و نوآورانه است که به کاربران امکان می‌دهد تا خلاقیت خود را به حداکثر برسانند و تصاویری شگفت‌انگیز و منحصر به فرد ایجاد کنند. این مدل با ارائه کیفیت بالا، سرعت و انعطاف‌پذیری، به یک انتخاب ایده‌آل برای تولید تصاویر مبتنی بر متن تبدیل شده است. همچنین، Imagen-3.0 با پشتیبانی از طیف گسترده‌ای از سبک‌ها و فرمت‌های تصویر، به کاربران امکان می‌دهد تا تصاویری را ایجاد کنند که دقیقاً با نیازها و خواسته‌های آن‌ها مطابقت داشته باشد. این مدل با ارائه یک رابط کاربری ساده و آسان، به کاربران امکان می‌دهد تا به راحتی از تمام قابلیت‌های آن استفاده کنند و تصاویری با کیفیت حرفه‌ای تولید کنند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت: imagen-3.0-generate-002 مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	متن توصیفی که محتوا، سبک یا ترکیب‌بندی تصویر تولیدی را مشخص می‌کند. حداکثر طول: 400 کاراکتر.
convert_base64_to_url	boolean	اگر True باشد، URL تصویر بازگردانده می‌شود. در غیر این صورت، فایل به صورت base64 ارائه می‌شود. مقدار پیش‌فرض: true
num_images	integer	تعداد تصاویری که باید تولید شوند. حداکثر: 4. مقدار پیش‌فرض: 1
seed	integer	با استفاده از یک seed یکسان و یک prompt یکسان، مدل در هر بار اجرا یک تصویر یکسان تولید می‌کند. حداکثر: 4294967295
enhance_prompt	boolean	پارامتر اختیاری برای استفاده از ویژگی بازنویسی prompt مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با prompt اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و هم ترازی prompt تأثیر بگذارد. مقدار پیش‌فرض: true
aspect_ratio	string	نسبت تصویر تولید شده. مقدار پیش‌فرض: 1:1 مقادیر مجاز (کلیک برای کپی):
person_generation	string	اجازه تولید تصاویر افراد. مقدار پیش‌فرض: allow_adult مقادیر مجاز (کلیک برای کپی):
safety_setting	string	سطح فیلتر ایمنی را اضافه می‌کند. مقدار پیش‌فرض: block_medium_and_above مقادیر مجاز (کلیک برای کپی):
add_watermark	boolean	اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیش‌فرض: false

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Racoon eating ice-cream",
            "model": "imagen-3.0-generate-002",
            "convert_base64_to_url": True,
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}