Image Modelsopenai

معرفی و مستندات مدل هوش مصنوعی dall-e-2

مستندات مدل تولید تصویر dall-e-2 از OpenAI، ارائه شده توسط ای آی کار (AI-KAR).

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند. برای دریافت بهترین نتیجه، استفاده از prompts انگلیسی توصیه می‌شود.

مدل DALL·E 2 یک سیستم هوش مصنوعی پیشرفته است که برای تولید تصاویر و آثار هنری با کیفیت بالا از توضیحات متنی طراحی شده است. این مدل بر پایه مدل قبلی خود، DALL·E 1، ساخته شده و از تکنیک‌های بهبود یافته برای ایجاد تصاویری واقع‌گرایانه‌تر و از نظر متنی دقیق‌تر استفاده می‌کند. DALL·E 2 قادر است تصاویر را با تنوع بسیار زیادی در سبک‌ها و موضوعات تولید کند، از جمله ایجاد تصاویر فوتورئالیستی، نقاشی‌های هنری، و طرح‌های مفهومی. این مدل می‌تواند تصاویر را از توضیحات بسیار خلاقانه و غیرمعمول تولید کند، و همچنین می‌تواند تغییرات و ویرایش‌هایی را بر روی تصاویر موجود اعمال کند. یکی از ویژگی‌های برجسته DALL·E 2، توانایی آن در درک و ترکیب مفاهیم مختلف در یک تصویر واحد است. به عنوان مثال، می‌توان از آن خواست تا تصویری از یک «خرس قطبی که در حال نواختن گیتار الکتریکی است» تولید کند، و مدل قادر خواهد بود این مفهوم غیرمعمول را به یک تصویر منسجم و قابل قبول تبدیل کند. این مدل از شبکه‌های عصبی عمیق و تکنیک‌های یادگیری ماشین پیشرفته برای تولید تصاویر استفاده می‌کند. DALL·E 2 با استفاده از داده‌های آموزشی گسترده‌ای که شامل میلیون‌ها تصویر و متن مرتبط است، آموزش داده شده است. این داده‌ها به مدل کمک می‌کنند تا ارتباط بین متن و تصویر را درک کند و تصاویر جدیدی را بر اساس توضیحات متنی تولید کند. DALL·E 2 کاربردهای فراوانی دارد، از جمله در زمینه‌های طراحی گرافیک، تبلیغات، هنر، و آموزش. این مدل می‌تواند به طراحان و هنرمندان کمک کند تا ایده‌های خود را به سرعت تجسم کنند، و همچنین می‌تواند به عنوان یک ابزار آموزشی برای کمک به افراد در یادگیری مفاهیم بصری مورد استفاده قرار گیرد. با این حال، استفاده از DALL·E 2 نیز با چالش‌هایی همراه است. یکی از این چالش‌ها، احتمال تولید تصاویر نامناسب یا مضر است. برای مقابله با این چالش، OpenAI اقداماتی را برای محدود کردن تولید تصاویر حاوی محتوای خشونت‌آمیز، تبعیض‌آمیز، یا غیراخلاقی انجام داده است. همچنین، این شرکت در حال توسعه ابزارهایی است که به کاربران امکان می‌دهد تا تصاویر تولید شده توسط DALL·E 2 را شناسایی و گزارش کنند. در مجموع، DALL·E 2 یک مدل هوش مصنوعی قدرتمند و نوآورانه است که پتانسیل زیادی برای تغییر نحوه تولید و مصرف تصاویر دارد. با این حال، استفاده مسئولانه و اخلاقی از این مدل برای جلوگیری از سوء استفاده و تضمین منافع عمومی ضروری است. این مدل توسط ای آی کار (AI-KAR) پشتیبانی و ارائه می‌شود.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید تصویر. مقدار ثابت 'dall-e-2' را بپذیرید.
مقادیر مجاز (کلیک برای کپی):
prompt
stringRequired
متن توضیحی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف می‌کند. حداکثر طول: 1000 کاراکتر.
n
number
تعداد تصاویری که باید تولید شوند. مقدار پیش‌فرض: 1. حداقل: 1، حداکثر: 10.
size
string
اندازه تصویر تولیدی. مقدار پیش‌فرض: 1024x1024.
مقادیر مجاز (کلیک برای کپی):
response_format
string
فرمت بازگشت تصاویر تولید شده. مقدار پیش‌فرض: url.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
            "model": "dall-e-2"
        }
    )
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))


if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "data": [
    {
      "url": "#",
      "b64_json": null
    }
  ],
  "meta": {
    "usage": {
      "tokens_used": 120000
    }
  }
}