Image Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی imagen-4-fast-generate
مستندات مدل تولید تصویر سریع imagen-4-fast-generate از گوگل، ارائه شده توسط ای ای کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، توصیه میشود از prompt های انگلیسی استفاده کنید.
مدل imagen-4-fast-generate یک مدل تولید تصویر است که توسط گوگل توسعه داده شده و برای سرعت بالا بهینه سازی شده است. این مدل در مقایسه با سایر مدلهای Imagen 4 مانند Imagen 4 Generate 001 (استاندارد) و Imagen 4 Ultra Generate 001 (کیفیت بالاتر، سرعت کمتر)، تصاویر را با سرعت بیشتری تولید میکند. این مدل برای کاربردهایی که نیاز به تولید سریع تصاویر دارند، مانند پیشنمایشها، نمونهسازی اولیه و تولید محتوای بصری در مقیاس بزرگ، بسیار مناسب است. با استفاده از این مدل، کاربران میتوانند با ارائه یک متن توصیفی (prompt)، تصاویر مرتبط را به سرعت تولید کنند. این مدل از طریق API قابل دسترسی است و امکان تنظیم پارامترهای مختلفی مانند نسبت تصویر، تعداد تصاویر تولیدی، و سطح ایمنی را فراهم میکند. همچنین، این مدل از قابلیت ارتقاء کیفیت prompt با استفاده از یک مدل زبانی بزرگ (LLM) بهره میبرد که میتواند به تولید تصاویر با کیفیت بالاتر و تطابق بهتر با prompt اصلی کمک کند. این قابلیت به صورت پیشفرض فعال است، اما کاربران میتوانند آن را غیرفعال کنند. مدل imagen-4-fast-generate با هدف ارائه یک راه حل سریع و کارآمد برای تولید تصاویر با کیفیت مناسب طراحی شده است و میتواند به عنوان یک ابزار قدرتمند در اختیار توسعهدهندگان، طراحان و تولیدکنندگان محتوا قرار گیرد. این مدل با ارائه سرعت بالا و قابلیت تنظیم پارامترها، امکان تولید تصاویر متنوع و متناسب با نیازهای مختلف را فراهم میکند. همچنین، با استفاده از قابلیت ارتقاء کیفیت prompt، کاربران میتوانند تصاویر با کیفیت بالاتر و تطابق بهتر با prompt اصلی تولید کنند. این مدل یک انتخاب عالی برای کاربرانی است که به دنبال یک راه حل سریع و کارآمد برای تولید تصاویر هستند. این مدل در پلتفرم ای ای کار (AI-KAR) در دسترس است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت: google/imagen-4.0-fast-generate-001 مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص میکند. حداکثر طول: 400 کاراکتر. |
convert_base64_to_url | boolean | اگر True باشد، URL تصویر بازگردانده میشود. در غیر این صورت، فایل به صورت base64 ارائه میشود. مقدار پیشفرض: true |
num_images | integer | تعداد تصاویری که باید تولید شوند. حداکثر: 4. مقدار پیشفرض: 1 |
seed | integer | با استفاده از یک seed ثابت و یک prompt یکسان، مدل همیشه یک تصویر یکسان تولید میکند. حداکثر: 4294967295 |
enhance_prompt | boolean | پارامتر اختیاری برای استفاده از قابلیت بازنویسی prompt مبتنی بر LLM برای تصاویر با کیفیت بالاتر که بهتر با prompt اصلی مطابقت دارند. غیرفعال کردن آن ممکن است بر کیفیت تصویر و هم ترازی prompt تأثیر بگذارد. مقدار پیشفرض: true |
aspect_ratio | string | نسبت تصویر تولید شده. مقدار پیشفرض: 1:1 مقادیر مجاز (کلیک برای کپی): |
person_generation | string | اجازه تولید تصاویر شامل افراد. مقدار پیشفرض: allow_adult مقادیر مجاز (کلیک برای کپی): |
safety_setting | string | سطح فیلتر ایمنی را اضافه میکند. مقدار پیشفرض: block_medium_and_above مقادیر مجاز (کلیک برای کپی): |
add_watermark | boolean | اضافه کردن یک واترمارک نامرئی به تصاویر تولید شده. مقدار پیشفرض: false |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "Racoon eating ice-cream",
"model": "google/imagen-4.0-fast-generate-001",
"aspect_ratio": "16:9"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"mime_type": "image/png",
"url": "#",
"prompt": "A raccoon, with a mischievous grin, holds a melting cone of mint chocolate chip ice cream in its front paws, enjoying a warm summer day in a picturesque park. The sunlight creates a gentle, golden glow around the raccoon, illuminating the soft, fluffy fur. The cone is dripping with ice cream, creating a scene of playful chaos. A detailed, high-quality photo with a shallow depth of field, blurring the background foliage, creating a soft and dreamy aesthetic. The vibrant green trees and lush grass provide a beautiful and tranquil setting for the raccoon's treat."
}
],
"meta": {
"usage": {
"tokens_used": 42000
}
}
}