Image Modelsbytedance
معرفی و مستندات مدل هوش مصنوعی seedream-v4-text-to-image
مستندات مدل تولید تصویر از متن seedream-v4-text-to-image، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه میشود.
مدل seedream-v4-text-to-image یک مدل هوش مصنوعی پیشرفته برای تولید تصاویر از متن است که توسط bytedance توسعه داده شده است. این مدل با سرعت بالا و دقت فراوان، تصاویری با کیفیت و مطابق با توضیحات متنی ارائه میدهد. یکی از ویژگیهای برجسته این مدل، ثبات در رندر شخصیتها است، به این معنی که اگر یک شخصیت خاص را در چندین تصویر مختلف درخواست کنید، مدل قادر است آن شخصیت را به طور consistent و با حفظ ویژگیهای ظاهری در تمام تصاویر تولید کند. کیفیت تصاویر تولید شده توسط این مدل با Gemini 2.5 Flash Image (Nano Banana) قابل مقایسه است. این مدل برای کاربردهای مختلفی از جمله تولید محتوای بصری برای شبکههای اجتماعی، طراحی گرافیکی، تولید تصاویر هنری و غیره مناسب است. با استفاده از این مدل، کاربران میتوانند به سادگی و با وارد کردن یک متن توصیفی، تصاویر دلخواه خود را ایجاد کنند. این مدل از طریق API قابل دسترسی است و کاربران میتوانند با استفاده از کلید API خود، از امکانات آن بهرهمند شوند. پارامترهای مختلفی برای کنترل فرآیند تولید تصویر در این مدل وجود دارد، از جمله اندازه تصویر، seed برای تولید تصاویر تکرارپذیر، فعال یا غیرفعال کردن safety checker، و تعداد تصاویر تولیدی. این مدل با بهرهگیری از الگوریتمهای پیشرفته یادگیری عمیق، قادر است تصاویر با جزئیات بالا و رنگهای زنده تولید کند. همچنین، این مدل از نظر مصرف منابع نیز بهینه شده است و با سرعت بالا تصاویر را تولید میکند. در مجموع، مدل seedream-v4-text-to-image یک ابزار قدرتمند و کارآمد برای تولید تصاویر از متن است که میتواند نیازهای مختلف کاربران را در زمینه تولید محتوای بصری برآورده کند. تیم ای آی کار (AI-KAR) این مدل را به عنوان یکی از بهترین گزینهها در زمینه تولید تصویر از متن پیشنهاد میکند. این مدل به دلیل سرعت بالا، کیفیت تصاویر تولیدی و ثبات در رندر شخصیتها، یک انتخاب عالی برای کاربران حرفهای و غیرحرفهای است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدلی که برای تولید تصویر استفاده میشود. مقادیر مجاز (کلیک برای کپی): |
image_size | string | object | اندازه تصویر تولید شده. مقادیر مجاز (کلیک برای کپی): |
seed | integer | مقدار seed برای تولید تصاویر تکرارپذیر. با استفاده از یک seed مشخص و یک prompt یکسان، همیشه یک تصویر یکسان تولید میشود. |
sync_mode | boolean | اگر روی true تنظیم شود، تابع منتظر میماند تا تصویر تولید و آپلود شود و سپس پاسخ را برمیگرداند. این کار باعث افزایش تاخیر میشود، اما به شما امکان میدهد تصویر را مستقیماً در پاسخ بدون نیاز به CDN دریافت کنید. |
enable_safety_checker | boolean | اگر روی True تنظیم شود، safety checker فعال میشود. |
prompt | stringRequired | متن توصیفی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص میکند. |
num_images | number | تعداد تصاویری که باید تولید شوند. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "bytedance/seedream-v4-text-to-image",
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses.",
"image_size": {
"width": 4096,
"height": 4096
},
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null
}
],
"meta": {
"usage": {
"tokens_used": 120000
}
}
}