Image Modelsopenai
معرفی و مستندات مدل هوش مصنوعی dall-e-2
مستندات مدل تولید تصویر dall-e-2 از OpenAI، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت ضعیف پشتیبانی میکند. برای دریافت بهترین نتیجه، استفاده از prompts انگلیسی توصیه میشود.
مدل DALL·E 2 یک سیستم هوش مصنوعی پیشرفته است که برای تولید تصاویر و آثار هنری با کیفیت بالا از توضیحات متنی طراحی شده است. این مدل بر پایه مدل قبلی خود، DALL·E 1، ساخته شده و از تکنیکهای بهبود یافته برای ایجاد تصاویری واقعگرایانهتر و از نظر متنی دقیقتر استفاده میکند. DALL·E 2 قادر است تصاویر را با تنوع بسیار زیادی در سبکها و موضوعات تولید کند، از جمله ایجاد تصاویر فوتورئالیستی، نقاشیهای هنری، و طرحهای مفهومی. این مدل میتواند تصاویر را از توضیحات بسیار خلاقانه و غیرمعمول تولید کند، و همچنین میتواند تغییرات و ویرایشهایی را بر روی تصاویر موجود اعمال کند. یکی از ویژگیهای برجسته DALL·E 2، توانایی آن در درک و ترکیب مفاهیم مختلف در یک تصویر واحد است. به عنوان مثال، میتوان از آن خواست تا تصویری از یک «خرس قطبی که در حال نواختن گیتار الکتریکی است» تولید کند، و مدل قادر خواهد بود این مفهوم غیرمعمول را به یک تصویر منسجم و قابل قبول تبدیل کند. این مدل از شبکههای عصبی عمیق و تکنیکهای یادگیری ماشین پیشرفته برای تولید تصاویر استفاده میکند. DALL·E 2 با استفاده از دادههای آموزشی گستردهای که شامل میلیونها تصویر و متن مرتبط است، آموزش داده شده است. این دادهها به مدل کمک میکنند تا ارتباط بین متن و تصویر را درک کند و تصاویر جدیدی را بر اساس توضیحات متنی تولید کند. DALL·E 2 کاربردهای فراوانی دارد، از جمله در زمینههای طراحی گرافیک، تبلیغات، هنر، و آموزش. این مدل میتواند به طراحان و هنرمندان کمک کند تا ایدههای خود را به سرعت تجسم کنند، و همچنین میتواند به عنوان یک ابزار آموزشی برای کمک به افراد در یادگیری مفاهیم بصری مورد استفاده قرار گیرد. با این حال، استفاده از DALL·E 2 نیز با چالشهایی همراه است. یکی از این چالشها، احتمال تولید تصاویر نامناسب یا مضر است. برای مقابله با این چالش، OpenAI اقداماتی را برای محدود کردن تولید تصاویر حاوی محتوای خشونتآمیز، تبعیضآمیز، یا غیراخلاقی انجام داده است. همچنین، این شرکت در حال توسعه ابزارهایی است که به کاربران امکان میدهد تا تصاویر تولید شده توسط DALL·E 2 را شناسایی و گزارش کنند. در مجموع، DALL·E 2 یک مدل هوش مصنوعی قدرتمند و نوآورانه است که پتانسیل زیادی برای تغییر نحوه تولید و مصرف تصاویر دارد. با این حال، استفاده مسئولانه و اخلاقی از این مدل برای جلوگیری از سوء استفاده و تضمین منافع عمومی ضروری است. این مدل توسط ای آی کار (AI-KAR) پشتیبانی و ارائه میشود.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید تصویر. مقدار ثابت 'dall-e-2' را بپذیرید. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | متن توضیحی که محتوا، سبک یا ترکیب تصویر تولیدی را توصیف میکند. حداکثر طول: 1000 کاراکتر. |
n | number | تعداد تصاویری که باید تولید شوند. مقدار پیشفرض: 1. حداقل: 1، حداکثر: 10. |
size | string | اندازه تصویر تولیدی. مقدار پیشفرض: 1024x1024. مقادیر مجاز (کلیک برای کپی): |
response_format | string | فرمت بازگشت تصاویر تولید شده. مقدار پیشفرض: url. مقادیر مجاز (کلیک برای کپی): |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
"model": "dall-e-2"
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}