Image Modelsopenai

معرفی و مستندات مدل هوش مصنوعی gpt-image-1

مستندات مدل تولید تصویر gpt-image-1 از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی در درک متن (prompt) پشتیبانی متوسطی دارد. برای دریافت بهترین نتیجه، توصیه می‌شود از عبارات ساده و واضح استفاده کنید.

مدل gpt-image-1 یک مدل چندوجهی قدرتمند است که توسط ای آی کار (AI-KAR) ارائه شده و قادر به تولید تصاویر جدید، ترکیب تصاویر موجود و اعمال ماسک‌های تصویری است. این مدل با استفاده از یک متن ورودی (prompt) هدایت می‌شود و می‌تواند تصاویر متنوع و خلاقانه‌ای را ایجاد کند. این مدل از API شرکت OpenAI استفاده می‌کند و برای استفاده از آن نیاز به کلید API دارید.

قابلیت‌های کلیدی:

1. تولید تصویر از متن: با ارائه یک متن توصیفی، مدل می‌تواند تصویری مرتبط با آن متن تولید کند. این قابلیت به کاربران امکان می‌دهد تا ایده‌های خود را به صورت بصری پیاده‌سازی کنند.
2. ترکیب تصاویر: مدل می‌تواند دو یا چند تصویر را با هم ترکیب کرده و یک تصویر جدید ایجاد کند. این قابلیت برای ایجاد تصاویر خلاقانه و منحصربه‌فرد بسیار مفید است.
3. اعمال ماسک تصویری: با استفاده از ماسک‌های تصویری، می‌توان بخش‌های خاصی از یک تصویر را ویرایش کرد یا تغییر داد. این قابلیت به کاربران امکان می‌دهد تا کنترل دقیقی بر روی جزئیات تصویر داشته باشند.
4. کنترل کیفیت تصویر: کاربران می‌توانند کیفیت تصویر تولید شده را از بین سه سطح (low، medium، high) انتخاب کنند. کیفیت بالاتر منجر به تصاویر با جزئیات بیشتر می‌شود.
5. تنظیم اندازه تصویر: مدل از اندازه‌های مختلف تصویر پشتیبانی می‌کند و کاربران می‌توانند اندازه دلخواه خود را انتخاب کنند.
6. فرمت‌های خروجی متنوع: تصاویر تولید شده می‌توانند در فرمت‌های مختلفی مانند PNG، JPEG و WebP ذخیره شوند.
7. تنظیم سطح فشرده‌سازی: کاربران می‌توانند سطح فشرده‌سازی تصاویر تولید شده را تنظیم کنند.
8. شفاف‌سازی پس‌زمینه: امکان تنظیم شفافیت برای پس‌زمینه تصاویر تولید شده وجود دارد.

موارد استفاده:

* تبلیغات و بازاریابی: تولید تصاویر جذاب و مرتبط با محصولات و خدمات.
* طراحی گرافیک: ایجاد طرح‌های گرافیکی خلاقانه و منحصربه‌فرد.
* تولید محتوا: تولید تصاویر برای وبلاگ‌ها، شبکه‌های اجتماعی و سایر پلتفرم‌های تولید محتوا.
* آموزش و سرگرمی: ایجاد تصاویر آموزشی و سرگرم‌کننده.
* هنر و خلاقیت: خلق آثار هنری دیجیتال.

نکات مهم:

* برای دریافت نتایج با جزئیات بیشتر، پارامتر `quality` را روی `high` تنظیم کنید.
* در صورت استفاده از پس‌زمینه شفاف، فرمت خروجی باید PNG یا WebP باشد.
* مدل از فایل‌های محلی برای ویرایش تصاویر پشتیبانی می‌کند و امکان استفاده از URL یا base64 وجود ندارد.

با استفاده از مدل gpt-image-1، کاربران می‌توانند به راحتی تصاویر خلاقانه و باکیفیت تولید کنند و ایده‌های خود را به واقعیت تبدیل کنند. ای آی کار (AI-KAR) این امکان را فراهم کرده تا با استفاده از API این مدل، بتوانید به راحتی در پروژه‌های خود از آن بهره ببرید.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت `openai/gpt-image-1` را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن ورودی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند. حداکثر طول: 32000 کاراکتر.
background
string
اجازه می‌دهد شفافیت پس‌زمینه تصویر(های) تولید شده را تنظیم کنید. وقتی `auto` استفاده می‌شود، مدل به طور خودکار بهترین پس‌زمینه را برای تصویر تعیین می‌کند. اگر `transparent` باشد، فرمت خروجی باید از شفافیت پشتیبانی کند، بنابراین باید روی `png` (مقدار پیش‌فرض) یا `webp` تنظیم شود. مقدار پیش‌فرض: `auto`.
مقادیر مجاز (کلیک برای کپی):
moderation
string
کنترل سطح پالایش محتوا برای تصاویر. مقدار پیش‌فرض: `auto`.
مقادیر مجاز (کلیک برای کپی):
n
number
(منسوخ شده) تعداد تصاویری که باید تولید شوند. مقدار پیش‌فرض: 1.
مقادیر مجاز (کلیک برای کپی):
output_compression
integer
سطح فشرده‌سازی (0-100٪) برای تصاویر تولید شده. مقدار پیش‌فرض: 100.
output_format
string
فرمت تصویر تولید شده. مقدار پیش‌فرض: `png`.
مقادیر مجاز (کلیک برای کپی):
quality
string
کیفیت تصویری که تولید خواهد شد. مقدار پیش‌فرض: `medium`.
مقادیر مجاز (کلیک برای کپی):
size
string
اندازه تصویر تولید شده. مقدار پیش‌فرض: `1024x1024`.
مقادیر مجاز (کلیک برای کپی):
response_format
string
فرمت بازگشت تصاویر تولید شده. مقدار پیش‌فرض: `url`.
مقادیر مجاز (کلیک برای کپی):
image
stringRequired
تصویر(های) برای ویرایش. باید یک فایل تصویر پشتیبانی شده یا آرایه‌ای از تصاویر باشد. هر تصویر باید یک فایل png، webp یا jpg کمتر از 50 مگابایت باشد. می‌توانید حداکثر 16 تصویر ارائه دهید.
mask
string
یک تصویر اضافی که نواحی کاملاً شفاف آن (به عنوان مثال، جایی که آلفا صفر است) نشان می‌دهد که تصویر کجا باید ویرایش شود. اگر چندین تصویر ارائه شده باشد، ماسک روی اولین تصویر اعمال می‌شود. باید یک فایل PNG معتبر، کمتر از 4 مگابایت و دارای ابعاد یکسان با تصویر باشد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Add a crown",
            "model": "openai/gpt-image-1",
            "size": "1024x1024"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "created": 1749730922,
  "background": "opaque",
  "data": [
    {
      "url": "#"
    }
  ],
  "output_format": "png",
  "quality": "medium",
  "size": "1536x1024",
  "usage": {
    "input_tokens": 29,
    "input_tokens_details": {
      "image_tokens": 0,
      "text_tokens": 29
    },
    "output_tokens": 1568,
    "total_tokens": 1597
  }
}