Image Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی gemini-2.5-flash-image
مستندات مدل تولید تصویر Gemini 2.5 Flash Image از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک متون فارسی در سطح قابل قبولی است، اما ممکن است در تولید تصاویر با توضیحات پیچیده فارسی، دقت کمتری داشته باشد.
مدل Gemini 2.5 Flash Image، جدیدترین و هوشمندترین مدل تولید تصویر گوگل تا آگوست 2025 است. این مدل قادر است تصاویر با کیفیت بالا و جزئیات دقیق تولید کند. یکی از ویژگیهای برجسته این مدل، استفاده از واترمارک دیجیتال نامرئی SynthID است. این واترمارک به تصاویر تولید یا ویرایششده توسط این مدل اضافه میشود و به شناسایی آنها به عنوان تصاویر تولید شده یا ویرایش شده توسط هوش مصنوعی کمک میکند. این امر به حفظ اصالت تصاویر و جلوگیری از سوء استفاده از آنها کمک میکند. مدل Gemini 2.5 Flash Image برای تولید انواع مختلف تصاویر مناسب است، از جمله تصاویر واقعی، تصاویر هنری، تصاویر تبلیغاتی و تصاویر مفهومی. این مدل میتواند با دریافت یک متن توصیفی (prompt)، تصویری مطابق با آن تولید کند. همچنین، این مدل قابلیت ویرایش تصاویر موجود را نیز دارد. به عنوان مثال، میتوان با استفاده از این مدل، رنگ یک شیء در تصویر را تغییر داد، یک شیء جدید به تصویر اضافه کرد یا پسزمینه تصویر را تغییر داد. یکی از کاربردهای مهم این مدل، تولید محتوای بصری برای شبکههای اجتماعی و وبسایتها است. با استفاده از این مدل، میتوان به سرعت و به آسانی تصاویر جذاب و با کیفیت بالا تولید کرد. همچنین، این مدل میتواند در زمینههای مختلفی مانند طراحی گرافیک، تبلیغات، آموزش و سرگرمی مورد استفاده قرار گیرد. مدل Gemini 2.5 Flash Image با استفاده از الگوریتمهای پیشرفته یادگیری عمیق، قادر است تصاویر با کیفیت بالا و جزئیات دقیق تولید کند. این مدل به طور مداوم در حال یادگیری و بهبود است و با گذشت زمان، تواناییهای آن افزایش مییابد. استفاده از واترمارک دیجیتال SynthID، یکی از ویژگیهای منحصر به فرد این مدل است که به حفظ اصالت تصاویر و جلوگیری از سوء استفاده از آنها کمک میکند. این مدل یک ابزار قدرتمند برای تولید محتوای بصری است و میتواند در زمینههای مختلفی مورد استفاده قرار گیرد. با توجه به تواناییهای بالای این مدل، انتظار میرود که در آینده نقش مهمی در تولید محتوای بصری ایفا کند. این مدل با ارائه امکانات پیشرفته و رابط کاربری آسان، به کاربران امکان میدهد تا به راحتی تصاویر مورد نظر خود را تولید کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت `google/gemini-2.5-flash-image` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص میکند. |
num_images | number | تعداد تصاویری که باید تولید شوند. حداقل مقدار 1 و حداکثر مقدار 4 است. مقدار پیشفرض 1 است. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "google/gemini-2.5-flash-image",
"prompt": "Racoon eating ice-cream"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}