Text Models (LLM)zhipu
معرفی و مستندات مدل هوش مصنوعی glm-4.5-air
مستندات مدل glm-4.5-air ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک نسبتا خوبی از دستور زبان فارسی دارد اما ممکن است در تولید متون پیچیده فارسی دچار مشکل شود.
مدل glm-4.5-air یک مدل استدلال ترکیبی است که توسط zhipu توسعه داده شده و در پلتفرم ای آی کار (AI-KAR) ارائه شده است. این مدل دارای دو حالت تفکر است: یک حالت تفکر برای استدلال پیچیده و استفاده از ابزارها، و یک حالت غیر تفکر برای پاسخهای فوری. این مدل یک نسخه سبکتر از مدل glm-4.5 است و برای کاربردهایی که نیاز به سرعت و کارایی بالا دارند، مناسب است.
glm-4.5-air قادر است وظایف مختلفی را انجام دهد، از جمله پاسخ به سوالات، تولید متن، ترجمه زبان، خلاصه سازی متن، و تولید کد. این مدل به خوبی برای استفاده در چتباتها، دستیارهای مجازی، و سایر برنامههای کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. حالت تفکر این مدل به آن اجازه میدهد تا مسائل پیچیده را حل کند و از ابزارهای مختلف برای کمک به خود استفاده کند. حالت غیر تفکر این مدل به آن اجازه میدهد تا به سرعت به سوالات ساده پاسخ دهد و وظایف ساده را انجام دهد.
برای استفاده از این مدل، ابتدا باید یک حساب کاربری در وبسایت ای آی کار (AI-KAR) ایجاد کنید و یک کلید API تولید کنید. سپس، میتوانید از کلید API خود برای ارسال درخواست به API مدل استفاده کنید. API مدل از فرمت JSON برای درخواستها و پاسخها استفاده میکند. برای ارسال یک درخواست، باید یک شی JSON ایجاد کنید که شامل پارامترهای مورد نیاز برای درخواست شما باشد. پارامترهای مورد نیاز شامل مدل، پیامها و سایر پارامترهای اختیاری است. پس از ارسال درخواست، API مدل یک شی JSON را برمیگرداند که شامل پاسخ مدل است. پاسخ مدل شامل متن تولید شده توسط مدل، و همچنین اطلاعات دیگری مانند تعداد توکنهای استفاده شده و دلیل پایان تولید متن است.
این مدل از قابلیت فراخوانی ابزارها (tools) پشتیبانی میکند. این قابلیت به مدل اجازه میدهد تا در صورت نیاز، از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند. به عنوان مثال، مدل میتواند از یک ابزار جستجو برای یافتن اطلاعات در مورد یک موضوع خاص استفاده کند، یا از یک ابزار ترجمه برای ترجمه متن از یک زبان به زبان دیگر. برای استفاده از این قابلیت، باید یک لیست از ابزارهای موجود را به مدل ارائه دهید. هر ابزار باید دارای یک نام، یک توضیحات، و یک طرح JSON باشد که پارامترهای مورد نیاز برای استفاده از ابزار را مشخص میکند.
به طور خلاصه، مدل glm-4.5-air یک مدل قدرتمند و کارآمد است که میتواند برای طیف گستردهای از وظایف استفاده شود. این مدل به خوبی برای استفاده در چتباتها، دستیارهای مجازی، و سایر برنامههای کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. با استفاده از قابلیت فراخوانی ابزارها، این مدل میتواند به طور خودکار از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند.
glm-4.5-air قادر است وظایف مختلفی را انجام دهد، از جمله پاسخ به سوالات، تولید متن، ترجمه زبان، خلاصه سازی متن، و تولید کد. این مدل به خوبی برای استفاده در چتباتها، دستیارهای مجازی، و سایر برنامههای کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. حالت تفکر این مدل به آن اجازه میدهد تا مسائل پیچیده را حل کند و از ابزارهای مختلف برای کمک به خود استفاده کند. حالت غیر تفکر این مدل به آن اجازه میدهد تا به سرعت به سوالات ساده پاسخ دهد و وظایف ساده را انجام دهد.
برای استفاده از این مدل، ابتدا باید یک حساب کاربری در وبسایت ای آی کار (AI-KAR) ایجاد کنید و یک کلید API تولید کنید. سپس، میتوانید از کلید API خود برای ارسال درخواست به API مدل استفاده کنید. API مدل از فرمت JSON برای درخواستها و پاسخها استفاده میکند. برای ارسال یک درخواست، باید یک شی JSON ایجاد کنید که شامل پارامترهای مورد نیاز برای درخواست شما باشد. پارامترهای مورد نیاز شامل مدل، پیامها و سایر پارامترهای اختیاری است. پس از ارسال درخواست، API مدل یک شی JSON را برمیگرداند که شامل پاسخ مدل است. پاسخ مدل شامل متن تولید شده توسط مدل، و همچنین اطلاعات دیگری مانند تعداد توکنهای استفاده شده و دلیل پایان تولید متن است.
این مدل از قابلیت فراخوانی ابزارها (tools) پشتیبانی میکند. این قابلیت به مدل اجازه میدهد تا در صورت نیاز، از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند. به عنوان مثال، مدل میتواند از یک ابزار جستجو برای یافتن اطلاعات در مورد یک موضوع خاص استفاده کند، یا از یک ابزار ترجمه برای ترجمه متن از یک زبان به زبان دیگر. برای استفاده از این قابلیت، باید یک لیست از ابزارهای موجود را به مدل ارائه دهید. هر ابزار باید دارای یک نام، یک توضیحات، و یک طرح JSON باشد که پارامترهای مورد نیاز برای استفاده از ابزار را مشخص میکند.
به طور خلاصه، مدل glm-4.5-air یک مدل قدرتمند و کارآمد است که میتواند برای طیف گستردهای از وظایف استفاده شود. این مدل به خوبی برای استفاده در چتباتها، دستیارهای مجازی، و سایر برنامههای کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. با استفاده از قابلیت فراخوانی ابزارها، این مدل میتواند به طور خودکار از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تکمیل چت. مقدار باید 'zhipu/glm-4.5-air' باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا به اینجا تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_completion_tokens | integer | حداکثر تعداد توکنهایی که میتوان برای تکمیل تولید کرد، شامل توکنهای خروجی قابل مشاهده و توکنهای استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینههای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل به صورت جریانی با استفاده از رویدادهای ارسال شده توسط سرور به کلاینت ارسال میشوند. مقدار پیشفرض: false |
stream_options | object | تنظیمات مربوط به جریان داده. |
tools | object[] | لیستی از ابزارهایی که مدل میتواند فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی میشوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل میتواند ورودیهای JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی میشود. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و به جای آن یک پیام تولید میکند. auto به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور میکند که آن ابزار را فراخوانی کند. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | تعیین اینکه آیا فراخوانی موازی تابع در هنگام استفاده از ابزار فعال شود یا خیر. |
n | integer | nullable | تعداد انتخابهای تکمیل چت که برای هر پیام ورودی باید تولید شود. توجه داشته باشید که هزینه بر اساس تعداد توکنهای تولید شده در تمام انتخابها محاسبه میشود. مقدار n را 1 نگه دارید تا هزینهها به حداقل برسد. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. به طور کلی توصیه میکنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را. |
frequency_penalty | number | nullable | عددی بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا به اینجا جریمه میکنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
presence_penalty | number | nullable | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا به اینجا ظاهر شدهاند یا خیر جریمه میکنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش میدهند. |
response_format | one of | شیئی که فرمتی را مشخص میکند که مدل باید خروجی دهد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"zhipu/glm-4.5-air",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "2025080117263376a343643b35435b",
"object": "chat.completion",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Hello! 👋 How can I assist you today? Feel free to ask any questions or share what you'd like to explore. 😊",
"reasoning_content": "\nWe are starting with a simple \"Hello\". Since the user just said \"Hello\", we should respond politely and ask how we can help.\n Let's keep it friendly and open-ended."
}
}
],
"created": 1754040395,
"model": "glm-4.5-air",
"usage": {
"completion_tokens": 159,
"prompt_tokens": 3,
"prompt_tokens_details": {
"cached_tokens": 4
},
"total_tokens": 162
},
"request_id": "2025080117263376a343643b35435b"
}