Image Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی gemini-2.5-flash-image

مستندات مدل تولید تصویر Gemini 2.5 Flash Image از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک متون فارسی در سطح قابل قبولی است، اما ممکن است در تولید تصاویر با توضیحات پیچیده فارسی، دقت کمتری داشته باشد.

مدل Gemini 2.5 Flash Image، جدیدترین و هوشمندترین مدل تولید تصویر گوگل تا آگوست 2025 است. این مدل قادر است تصاویر با کیفیت بالا و جزئیات دقیق تولید کند. یکی از ویژگی‌های برجسته این مدل، استفاده از واترمارک دیجیتال نامرئی SynthID است. این واترمارک به تصاویر تولید یا ویرایش‌شده توسط این مدل اضافه می‌شود و به شناسایی آن‌ها به عنوان تصاویر تولید شده یا ویرایش شده توسط هوش مصنوعی کمک می‌کند. این امر به حفظ اصالت تصاویر و جلوگیری از سوء استفاده از آن‌ها کمک می‌کند. مدل Gemini 2.5 Flash Image برای تولید انواع مختلف تصاویر مناسب است، از جمله تصاویر واقعی، تصاویر هنری، تصاویر تبلیغاتی و تصاویر مفهومی. این مدل می‌تواند با دریافت یک متن توصیفی (prompt)، تصویری مطابق با آن تولید کند. همچنین، این مدل قابلیت ویرایش تصاویر موجود را نیز دارد. به عنوان مثال، می‌توان با استفاده از این مدل، رنگ یک شیء در تصویر را تغییر داد، یک شیء جدید به تصویر اضافه کرد یا پس‌زمینه تصویر را تغییر داد. یکی از کاربردهای مهم این مدل، تولید محتوای بصری برای شبکه‌های اجتماعی و وب‌سایت‌ها است. با استفاده از این مدل، می‌توان به سرعت و به آسانی تصاویر جذاب و با کیفیت بالا تولید کرد. همچنین، این مدل می‌تواند در زمینه‌های مختلفی مانند طراحی گرافیک، تبلیغات، آموزش و سرگرمی مورد استفاده قرار گیرد. مدل Gemini 2.5 Flash Image با استفاده از الگوریتم‌های پیشرفته یادگیری عمیق، قادر است تصاویر با کیفیت بالا و جزئیات دقیق تولید کند. این مدل به طور مداوم در حال یادگیری و بهبود است و با گذشت زمان، توانایی‌های آن افزایش می‌یابد. استفاده از واترمارک دیجیتال SynthID، یکی از ویژگی‌های منحصر به فرد این مدل است که به حفظ اصالت تصاویر و جلوگیری از سوء استفاده از آن‌ها کمک می‌کند. این مدل یک ابزار قدرتمند برای تولید محتوای بصری است و می‌تواند در زمینه‌های مختلفی مورد استفاده قرار گیرد. با توجه به توانایی‌های بالای این مدل، انتظار می‌رود که در آینده نقش مهمی در تولید محتوای بصری ایفا کند. این مدل با ارائه امکانات پیشرفته و رابط کاربری آسان، به کاربران امکان می‌دهد تا به راحتی تصاویر مورد نظر خود را تولید کنند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده برای تولید تصویر. مقدار ثابت `google/gemini-2.5-flash-image` را بپذیرید. مقادیر مجاز (کلیک برای کپی):
prompt	stringRequired	متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص می‌کند.
num_images	number	تعداد تصاویری که باید تولید شوند. حداقل مقدار 1 و حداکثر مقدار 4 است. مقدار پیش‌فرض 1 است.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "google/gemini-2.5-flash-image",
            "prompt": "Racoon eating ice-cream"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}