Image Modelsxai
معرفی و مستندات مدل هوش مصنوعی grok-2-image
مستندات مدل تولید تصویر grok-2-image از ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای دریافت بهترین نتیجه، استفاده از prompt های انگلیسی توصیه میشود.
مدل grok-2-image یک مدل تولید تصویر است که توسط xAI توسعه داده شده و از تابستان سال 2025 به عنوان مدل اصلی تولید تصویر این شرکت شناخته میشود. این مدل قادر است تصاویر فوتورئالیستی را از روی متن تولید کند. به این معنی که شما میتوانید با ارائه یک توضیح متنی، تصویری با کیفیت بالا و بسیار واقعی دریافت کنید. این مدل برای تولید انواع مختلف تصاویر، از مناظر طبیعی گرفته تا تصاویر انتزاعی و حتی تصاویر شخصیتها و اشیاء، مناسب است. یکی از ویژگیهای برجسته grok-2-image، توانایی آن در درک دقیق دستورات متنی است. این مدل میتواند جزئیات موجود در متن را به خوبی تفسیر کرده و تصویری مطابق با آن تولید کند. به عنوان مثال، اگر شما در متن خود به رنگ خاصی اشاره کنید، مدل قادر خواهد بود آن رنگ را به درستی در تصویر تولید شده اعمال کند. همچنین، این مدل از قابلیتهای پیشرفتهای برای کنترل سبک و ترکیببندی تصویر برخوردار است. شما میتوانید با استفاده از دستورات متنی، سبک هنری مورد نظر خود را مشخص کنید و یا ترکیببندی تصویر را به دلخواه تغییر دهید. این امکان به شما اجازه میدهد تا تصاویری کاملاً منحصر به فرد و مطابق با سلیقه خود ایجاد کنید. علاوه بر این، grok-2-image از نظر سرعت و کارایی نیز بسیار بهینه است. این مدل میتواند تصاویر را در مدت زمان کوتاهی تولید کند و به شما امکان میدهد تا به سرعت به نتایج مورد نظر خود دست یابید. این ویژگی برای کاربردهایی که نیاز به تولید سریع تصاویر دارند، بسیار مهم است. در مجموع، grok-2-image یک مدل قدرتمند و versatile برای تولید تصاویر فوتورئالیستی از روی متن است. این مدل با دقت بالا، سرعت مناسب و قابلیتهای کنترلی پیشرفته، ابزاری ارزشمند برای هنرمندان، طراحان و هر کسی است که به دنبال تولید تصاویر با کیفیت بالا و منحصر به فرد است. این مدل در ای آی کار (AI-KAR) در دسترس است و شما میتوانید از طریق API آن به راحتی از آن استفاده کنید. با استفاده از grok-2-image، میتوانید ایدههای خود را به سرعت و به آسانی به تصاویر واقعی تبدیل کنید. این مدل به شما امکان میدهد تا خلاقیت خود را به حداکثر برسانید و تصاویری را ایجاد کنید که قبلاً تصور آن را هم نمیکردید.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدلی که برای تولید تصویر استفاده میشود. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیح متنی که محتوا، سبک یا ترکیب تصویر تولیدی را مشخص میکند. |
n | number | تعداد تصاویری که باید تولید شوند. مقدار باید بین 1 و 10 باشد. |
response_format | string | فرمت پاسخ که تصاویر تولید شده در آن برگردانده میشوند. مقادیر مجاز (کلیک برای کپی): |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "x-ai/grok-2-image",
"prompt": "A T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses."
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"revised_prompt": "A high-resolution photograph of a T-Rex relaxing on a beach, lying on a sun lounger and wearing sunglasses. The T-Rex is facing slightly to the right, with its sunglasses clearly visible. The background features a calm ocean and a few palm trees, set during the day with natural, soft lighting. The beach is relatively empty, focusing attention on the T-Rex. There are no distracting elements like birds or other animals, ensuring the T-Rex remains the central figure in the composition. The overall mood is serene and tranquil, emphasizing the unusual yet peaceful scene."
}
],
"meta": {
"usage": {
"tokens_used": 147000
}
}
}