Image Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی gemini-3-pro-image-preview-edit
مستندات مدل gemini-3-pro-image-preview-edit از گوگل، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک دستورات فارسی ممکن است نیازمند عبارات ساده و واضح باشد.
مدل gemini-3-pro-image-preview-edit از گوگل، که در نوامبر 2025 به عنوان پیشنمایش منتشر شده، هوشمندترین مدل تبدیل تصویر به تصویر گوگل است. این مدل چندین تصویر را به عنوان ورودی دریافت میکند و با استفاده از دستورالعمل (prompt) مشخص میکند که چگونه این تصاویر باید استفاده یا ترکیب شوند. این مدل به کاربران امکان میدهد تا با ترکیب تصاویر مختلف و ارائه یک دستور متنی، تصاویر جدید و خلاقانهای ایجاد کنند. برای مثال، میتوان دو تصویر را با هم ترکیب کرد و از مدل خواست تا یک شیء خاص را به تصویر اضافه کند یا سبک تصویر را تغییر دهد. این مدل با درک عمیق از محتوای تصاویر و دستورالعمل ارائه شده، قادر است تصاویر با کیفیت و مرتبط تولید کند.
این مدل برای کاربردهای مختلفی مناسب است، از جمله:
- تولید محتوای خلاقانه: با استفاده از این مدل، کاربران میتوانند به سرعت و به آسانی تصاویر جدید و خلاقانهای ایجاد کنند.
- ویرایش تصاویر: این مدل امکان ویرایش تصاویر موجود را با استفاده از دستورالعملهای متنی فراهم میکند.
- ایجاد پیشنمایش: کاربران میتوانند از این مدل برای ایجاد پیشنمایش از طرحها و ایدههای خود استفاده کنند.
- بهبود کیفیت تصاویر: این مدل میتواند برای بهبود کیفیت تصاویر موجود، مانند افزایش وضوح یا کاهش نویز، استفاده شود.
برای استفاده از این مدل، کاربران باید یک کلید API معتبر داشته باشند. API این مدل امکانات گستردهای را برای کنترل فرآیند تولید تصویر فراهم میکند، از جمله تعیین نسبت تصویر، تعداد تصاویر تولیدی و پارامترهای دیگر. با توجه به قابلیتهای پیشرفته و انعطافپذیری بالای این مدل، میتوان از آن در زمینههای مختلفی مانند تبلیغات، طراحی گرافیک، تولید محتوا و آموزش استفاده کرد. این مدل با ارائه نتایج با کیفیت و مرتبط، به کاربران کمک میکند تا ایدههای خود را به واقعیت تبدیل کنند و محتوای بصری جذاب و مؤثری ایجاد کنند.
یکی از ویژگیهای برجسته این مدل، توانایی آن در درک و تفسیر دستورالعملهای متنی پیچیده است. این امر به کاربران امکان میدهد تا با ارائه دستورالعملهای دقیق و جزئی، تصاویر دقیقی را تولید کنند. همچنین، این مدل از طیف گستردهای از سبکها و تکنیکهای هنری پشتیبانی میکند، که به کاربران امکان میدهد تا تصاویری با سبکهای مختلف ایجاد کنند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار این فیلد باید `google/gemini-3-pro-image-preview-edit` باشد. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | دستور متنی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف میکند. |
image_urls | stringRequired | لیستی از آدرسهای اینترنتی (URL) یا تصاویر کدگذاری شده Base64 برای ویرایش. |
num_images | number | تعداد تصاویری که باید تولید شوند. مقدار پیشفرض 1 است. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "google/gemini-3-pro-image-preview-edit",
"image_urls": [
"https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
"https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/blue-mug.jpg"
],
"prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}