Image Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی imagen-4-ultra-generate
مستندات مدل تولید تصویر imagen-4-ultra-generate از گوگل، ارائه شده توسط ای ای کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای نتایج بهتر، استفاده از دستورات انگلیسی توصیه میشود.
مدل imagen-4-ultra-generate یک مدل پیشرفته تولید تصویر است که توسط گوگل توسعه داده شده و برای تولید تصاویر فوتورئالیستی و رندر دقیق متن طراحی شده است. این مدل به طور خاص برای استفادههای حرفهای با کیفیت بالا مناسب است. با استفاده از این مدل، کاربران میتوانند تصاویری با جزئیات بسیار بالا و کیفیت بصری فوقالعاده ایجاد کنند. این مدل قادر است تا دستورات متنی پیچیده را درک کرده و تصاویری مطابق با توضیحات ارائه شده تولید کند. یکی از ویژگیهای برجسته این مدل، توانایی آن در رندر دقیق متن در تصاویر است که آن را برای کاربردهایی مانند تولید پوستر، تبلیغات و محتوای بصری با متن مناسب میسازد. این مدل از طریق API قابل دسترسی است و کاربران میتوانند با ارسال درخواستهای JSON، تصاویر مورد نظر خود را تولید کنند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در دسترس هستند، از جمله تعیین نسبت تصویر، تعداد تصاویر تولیدی، و سطح ایمنی. همچنین، کاربران میتوانند از یک seed مشخص برای تولید تصاویر تکرارپذیر استفاده کنند. این مدل از قابلیت enhance_prompt نیز بهره میبرد که با استفاده از یک مدل زبانی بزرگ (LLM)، دستورات متنی را بازنویسی کرده و کیفیت تصاویر تولیدی را بهبود میبخشد. با این حال، غیرفعال کردن این قابلیت ممکن است بر کیفیت تصویر و تطابق آن با دستور اصلی تأثیر بگذارد. مدل imagen-4-ultra-generate به کاربران امکان میدهد تا تصاویری با کیفیت بالا و مطابق با نیازهای خاص خود ایجاد کنند. این مدل با ارائه پارامترهای کنترلی متنوع و قابلیتهای پیشرفته، ابزاری قدرتمند برای تولید محتوای بصری حرفهای است. این مدل در ای ای کار (AI-KAR) در دسترس است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت `google/imagen-4.0-ultra-generate-001` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | دستور متنی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف میکند. حداکثر طول: 400 کاراکتر. |
convert_base64_to_url | boolean | اگر `True` باشد، URL تصویر بازگردانده میشود. در غیر این صورت، فایل به صورت base64 ارائه میشود. مقدار پیشفرض: `true`. |
num_images | integer | تعداد تصاویر تولیدی. حداکثر: 4. مقدار پیشفرض: 1. |
seed | integer | یک seed مشخص برای تولید تصاویر تکرارپذیر. با استفاده از یک seed یکسان و دستور یکسان، یک نسخه یکسان از مدل، هر بار یک تصویر یکسان تولید میکند. حداکثر: 4294967295. |
enhance_prompt | boolean | پارامتر اختیاری برای استفاده از ویژگی بازنویسی دستور مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با دستور اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و هم ترازی دستور تأثیر بگذارد. مقدار پیشفرض: `true`. |
aspect_ratio | string | نسبت تصویر تولیدی. مقدار پیشفرض: `1:1`. مقادیر مجاز (کلیک برای کپی): |
person_generation | string | اجازه تولید تصاویر شامل افراد. مقدار پیشفرض: `allow_adult`. مقادیر مجاز (کلیک برای کپی): |
safety_setting | string | سطح فیلتر ایمنی را اضافه میکند. مقدار پیشفرض: `block_medium_and_above`. مقادیر مجاز (کلیک برای کپی): |
add_watermark | boolean | اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیشفرض: `false`. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "Racoon eating ice-cream",
"model": "google/imagen-4.0-ultra-generate-001",
"aspect_ratio": "16:9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"mime_type": "image/png",
"url": "#",
"prompt": "A curious raccoon sitting upright on a park bench, intently focused on licking a melting scoop of vanilla ice cream in a waffle cone. The raccoon has its small paws wrapped around the cone, and a tiny bit of ice cream is smeared on its nose and whiskers. The fur is ruffled and slightly damp from the treat. The park setting is sunny with dappled light filtering through the leaves of a large oak tree in the background. Autumn leaves are scattered on the ground near the bench. The ice cream is dripping slightly down the cone, and a small puddle is forming on the wooden bench. The image is captured at eye level with the raccoon."
}
],
"meta": {
"usage": {
"tokens_used": 126000
}
}
}