Image Modelsopenai
معرفی و مستندات مدل هوش مصنوعی gpt-image-1
مستندات مدل تولید تصویر gpt-image-1 از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی در درک متن (prompt) پشتیبانی متوسطی دارد. برای دریافت بهترین نتیجه، توصیه میشود از عبارات ساده و واضح استفاده کنید.
مدل gpt-image-1 یک مدل چندوجهی قدرتمند است که توسط ای آی کار (AI-KAR) ارائه شده و قادر به تولید تصاویر جدید، ترکیب تصاویر موجود و اعمال ماسکهای تصویری است. این مدل با استفاده از یک متن ورودی (prompt) هدایت میشود و میتواند تصاویر متنوع و خلاقانهای را ایجاد کند. این مدل از API شرکت OpenAI استفاده میکند و برای استفاده از آن نیاز به کلید API دارید.
قابلیتهای کلیدی:
1. تولید تصویر از متن: با ارائه یک متن توصیفی، مدل میتواند تصویری مرتبط با آن متن تولید کند. این قابلیت به کاربران امکان میدهد تا ایدههای خود را به صورت بصری پیادهسازی کنند.
2. ترکیب تصاویر: مدل میتواند دو یا چند تصویر را با هم ترکیب کرده و یک تصویر جدید ایجاد کند. این قابلیت برای ایجاد تصاویر خلاقانه و منحصربهفرد بسیار مفید است.
3. اعمال ماسک تصویری: با استفاده از ماسکهای تصویری، میتوان بخشهای خاصی از یک تصویر را ویرایش کرد یا تغییر داد. این قابلیت به کاربران امکان میدهد تا کنترل دقیقی بر روی جزئیات تصویر داشته باشند.
4. کنترل کیفیت تصویر: کاربران میتوانند کیفیت تصویر تولید شده را از بین سه سطح (low، medium، high) انتخاب کنند. کیفیت بالاتر منجر به تصاویر با جزئیات بیشتر میشود.
5. تنظیم اندازه تصویر: مدل از اندازههای مختلف تصویر پشتیبانی میکند و کاربران میتوانند اندازه دلخواه خود را انتخاب کنند.
6. فرمتهای خروجی متنوع: تصاویر تولید شده میتوانند در فرمتهای مختلفی مانند PNG، JPEG و WebP ذخیره شوند.
7. تنظیم سطح فشردهسازی: کاربران میتوانند سطح فشردهسازی تصاویر تولید شده را تنظیم کنند.
8. شفافسازی پسزمینه: امکان تنظیم شفافیت برای پسزمینه تصاویر تولید شده وجود دارد.
موارد استفاده:
* تبلیغات و بازاریابی: تولید تصاویر جذاب و مرتبط با محصولات و خدمات.
* طراحی گرافیک: ایجاد طرحهای گرافیکی خلاقانه و منحصربهفرد.
* تولید محتوا: تولید تصاویر برای وبلاگها، شبکههای اجتماعی و سایر پلتفرمهای تولید محتوا.
* آموزش و سرگرمی: ایجاد تصاویر آموزشی و سرگرمکننده.
* هنر و خلاقیت: خلق آثار هنری دیجیتال.
نکات مهم:
* برای دریافت نتایج با جزئیات بیشتر، پارامتر `quality` را روی `high` تنظیم کنید.
* در صورت استفاده از پسزمینه شفاف، فرمت خروجی باید PNG یا WebP باشد.
* مدل از فایلهای محلی برای ویرایش تصاویر پشتیبانی میکند و امکان استفاده از URL یا base64 وجود ندارد.
با استفاده از مدل gpt-image-1، کاربران میتوانند به راحتی تصاویر خلاقانه و باکیفیت تولید کنند و ایدههای خود را به واقعیت تبدیل کنند. ای آی کار (AI-KAR) این امکان را فراهم کرده تا با استفاده از API این مدل، بتوانید به راحتی در پروژههای خود از آن بهره ببرید.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت `openai/gpt-image-1` را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف میکند. حداکثر طول: 32000 کاراکتر. |
background | string | اجازه میدهد شفافیت پسزمینه تصویر(های) تولید شده را تنظیم کنید. وقتی `auto` استفاده میشود، مدل به طور خودکار بهترین پسزمینه را برای تصویر تعیین میکند. اگر `transparent` باشد، فرمت خروجی باید از شفافیت پشتیبانی کند، بنابراین باید روی `png` (مقدار پیشفرض) یا `webp` تنظیم شود. مقدار پیشفرض: `auto`. مقادیر مجاز (کلیک برای کپی): |
moderation | string | کنترل سطح پالایش محتوا برای تصاویر. مقدار پیشفرض: `auto`. مقادیر مجاز (کلیک برای کپی): |
n | number | (منسوخ شده) تعداد تصاویری که باید تولید شوند. مقدار پیشفرض: 1. مقادیر مجاز (کلیک برای کپی): |
output_compression | integer | سطح فشردهسازی (0-100٪) برای تصاویر تولید شده. مقدار پیشفرض: 100. |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض: `png`. مقادیر مجاز (کلیک برای کپی): |
quality | string | کیفیت تصویری که تولید خواهد شد. مقدار پیشفرض: `medium`. مقادیر مجاز (کلیک برای کپی): |
size | string | اندازه تصویر تولید شده. مقدار پیشفرض: `1024x1024`. مقادیر مجاز (کلیک برای کپی): |
response_format | string | فرمت بازگشت تصاویر تولید شده. مقدار پیشفرض: `url`. مقادیر مجاز (کلیک برای کپی): |
image | stringRequired | تصویر(های) برای ویرایش. باید یک فایل تصویر پشتیبانی شده یا آرایهای از تصاویر باشد. هر تصویر باید یک فایل png، webp یا jpg کمتر از 50 مگابایت باشد. میتوانید حداکثر 16 تصویر ارائه دهید. |
mask | string | یک تصویر اضافی که نواحی کاملاً شفاف آن (به عنوان مثال، جایی که آلفا صفر است) نشان میدهد که تصویر کجا باید ویرایش شود. اگر چندین تصویر ارائه شده باشد، ماسک روی اولین تصویر اعمال میشود. باید یک فایل PNG معتبر، کمتر از 4 مگابایت و دارای ابعاد یکسان با تصویر باشد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "Add a crown",
"model": "openai/gpt-image-1",
"size": "1024x1024"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"created": 1749730922,
"background": "opaque",
"data": [
{
"url": "#"
}
],
"output_format": "png",
"quality": "medium",
"size": "1536x1024",
"usage": {
"input_tokens": 29,
"input_tokens_details": {
"image_tokens": 0,
"text_tokens": 29
},
"output_tokens": 1568,
"total_tokens": 1597
}
}