Text Models (LLM)zhipu
معرفی و مستندات مدل هوش مصنوعی glm-4.5
مستندات مدل glm-4.5 ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل glm-4.5 یک مدل هوش مصنوعی ترکیبی است که توسط Zhipu توسعه داده شده است. این مدل دارای دو حالت تفکر است: یک حالت برای استدلال پیچیده و استفاده از ابزارها، و یک حالت غیر تفکر برای پاسخهای فوری. این ویژگی به مدل امکان میدهد تا در سناریوهای مختلف عملکرد بهینهای داشته باشد. در حالت تفکر، مدل قادر است مسائل پیچیده را تجزیه و تحلیل کرده و با استفاده از ابزارهای مختلف، راهحلهای مناسب را پیدا کند. این حالت برای وظایفی مانند برنامهریزی، حل مسائل ریاضی و تحلیل دادهها بسیار مفید است. در حالت غیر تفکر، مدل قادر است به سرعت به سوالات و درخواستهای ساده پاسخ دهد. این حالت برای وظایفی مانند پاسخ به سوالات متداول، ارائه اطلاعات عمومی و انجام دستورات ساده مناسب است. مدل glm-4.5 از طریق API قابل دسترسی است و توسعهدهندگان میتوانند از آن در برنامههای خود استفاده کنند. برای استفاده از API، ابتدا باید یک حساب کاربری ایجاد کرده و یک کلید API دریافت کنید. سپس میتوانید با استفاده از زبانهای برنامهنویسی مختلف مانند Python، JavaScript، cURL و HTTP، درخواستهای خود را به API ارسال کنید. پارامترهای مختلفی برای کنترل رفتار مدل وجود دارد، از جمله `model`، `messages`، `max_completion_tokens`، `max_tokens`، `stream`، `tools` و `tool_choice`. با تنظیم این پارامترها، میتوانید خروجی مدل را بهینه کرده و به نتایج دلخواه برسید. مدل glm-4.5 در زمینههای مختلفی کاربرد دارد، از جمله: تولید محتوا، ترجمه زبان، پاسخ به سوالات، خلاصهسازی متن، تحلیل احساسات و تولید کد. این مدل میتواند به عنوان یک ابزار قدرتمند برای افزایش بهرهوری و بهبود کیفیت کار در سازمانها و شرکتها مورد استفاده قرار گیرد. ای آی کار (AI-KAR) این مدل را به عنوان یکی از بهترین مدلهای موجود در بازار به شما پیشنهاد میکند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده. مقدار باید `zhipu/glm-4.5` باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا کنون تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلفی از پیامها ( modalities ) مانند متن، اسناد ( txt، pdf )، تصاویر و صدا پشتیبانی میشوند. |
max_completion_tokens | integer | حد بالایی برای تعداد توکنهایی که میتوان برای تکمیل تولید کرد، از جمله توکنهای خروجی قابل مشاهده و توکنهای استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینههای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل با استفاده از رویدادهای ارسال شده توسط سرور (server-sent events) به صورت جریانی به کلاینت ارسال میشوند. مقدار پیشفرض: false |
stream_options | object | تنظیمات مربوط به استریم کردن |
tools | one of[] | ابزارهایی برای مدلهای zhipu که از فراخوانی تابع و جستجوی وب پشتیبانی میکنند. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. `none` به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و به جای آن یک پیام تولید میکند. `auto` به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. `required` به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق `{"type": "function", "function": {"name": "my_function"}}` مدل را مجبور میکند تا آن ابزار را فراخوانی کند. `none` مقدار پیشفرض زمانی است که هیچ ابزاری وجود نداشته باشد. `auto` مقدار پیشفرض در صورت وجود ابزار است. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | فعال کردن فراخوانی موازی تابع در هنگام استفاده از ابزار. |
n | integer | nullable | تعداد انتخابهای تکمیل چت که برای هر پیام ورودی باید تولید شود. توجه داشته باشید که هزینه شما بر اساس تعداد توکنهای تولید شده در تمام انتخابها محاسبه میشود. `n` را روی 1 نگه دارید تا هزینهها به حداقل برسد. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. به طور کلی توصیه میکنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را. |
frequency_penalty | number | nullable | عدد بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
presence_penalty | number | nullable | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند جریمه میکنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش میدهند. |
response_format | one of | شیئی که فرمت خروجی مدل را مشخص میکند. |
thinking | object | کنترل اینکه آیا مدل زنجیره تفکر را فعال میکند یا خیر. فقط توسط مدلهای GLM-4.5 و بالاتر پشتیبانی میشود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"zhipu/glm-4.5",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "202508011715489a4cb4a7a145463b",
"object": "chat.completion",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Hello! How can I assist you today?</think>"
}
}
],
"created": 1754039749,
"model": "glm-4.5",
"usage": {
"completion_tokens": 65,
"prompt_tokens": 8,
"prompt_tokens_details": {
"cached_tokens": 0
},
"total_tokens": 73
},
"request_id": "202508011715489a4cb4a7a145463b"
}