Text Models (LLM)zhipu

معرفی و مستندات مدل هوش مصنوعی glm-4.5

مستندات مدل glm-4.5 ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند.

مدل glm-4.5 یک مدل هوش مصنوعی ترکیبی است که توسط Zhipu توسعه داده شده است. این مدل دارای دو حالت تفکر است: یک حالت برای استدلال پیچیده و استفاده از ابزارها، و یک حالت غیر تفکر برای پاسخ‌های فوری. این ویژگی به مدل امکان می‌دهد تا در سناریوهای مختلف عملکرد بهینه‌ای داشته باشد. در حالت تفکر، مدل قادر است مسائل پیچیده را تجزیه و تحلیل کرده و با استفاده از ابزارهای مختلف، راه‌حل‌های مناسب را پیدا کند. این حالت برای وظایفی مانند برنامه‌ریزی، حل مسائل ریاضی و تحلیل داده‌ها بسیار مفید است. در حالت غیر تفکر، مدل قادر است به سرعت به سوالات و درخواست‌های ساده پاسخ دهد. این حالت برای وظایفی مانند پاسخ به سوالات متداول، ارائه اطلاعات عمومی و انجام دستورات ساده مناسب است. مدل glm-4.5 از طریق API قابل دسترسی است و توسعه‌دهندگان می‌توانند از آن در برنامه‌های خود استفاده کنند. برای استفاده از API، ابتدا باید یک حساب کاربری ایجاد کرده و یک کلید API دریافت کنید. سپس می‌توانید با استفاده از زبان‌های برنامه‌نویسی مختلف مانند Python، JavaScript، cURL و HTTP، درخواست‌های خود را به API ارسال کنید. پارامترهای مختلفی برای کنترل رفتار مدل وجود دارد، از جمله `model`، `messages`، `max_completion_tokens`، `max_tokens`، `stream`، `tools` و `tool_choice`. با تنظیم این پارامترها، می‌توانید خروجی مدل را بهینه کرده و به نتایج دلخواه برسید. مدل glm-4.5 در زمینه‌های مختلفی کاربرد دارد، از جمله: تولید محتوا، ترجمه زبان، پاسخ به سوالات، خلاصه‌سازی متن، تحلیل احساسات و تولید کد. این مدل می‌تواند به عنوان یک ابزار قدرتمند برای افزایش بهره‌وری و بهبود کیفیت کار در سازمان‌ها و شرکت‌ها مورد استفاده قرار گیرد. ای آی کار (AI-KAR) این مدل را به عنوان یکی از بهترین مدل‌های موجود در بازار به شما پیشنهاد می‌کند.

مشخصات فنی (API References)

پارامتر	نوع	توضیحات و مقادیر
model	stringRequired	مدل مورد استفاده. مقدار باید `zhipu/glm-4.5` باشد. مقادیر مجاز (کلیک برای کپی):
messages	one of[]Required	لیستی از پیام‌ها که مکالمه را تا کنون تشکیل می‌دهند. بسته به مدلی که استفاده می‌کنید، انواع مختلفی از پیام‌ها ( modalities ) مانند متن، اسناد ( txt، pdf )، تصاویر و صدا پشتیبانی می‌شوند.
max_completion_tokens	integer	حد بالایی برای تعداد توکن‌هایی که می‌توان برای تکمیل تولید کرد، از جمله توکن‌های خروجی قابل مشاهده و توکن‌های استدلال. حداقل مقدار: 1
max_tokens	number	حداکثر تعداد توکن‌هایی که می‌توان در تکمیل چت تولید کرد. این مقدار می‌تواند برای کنترل هزینه‌های متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1
stream	boolean	اگر روی True تنظیم شود، داده‌های پاسخ مدل با استفاده از رویدادهای ارسال شده توسط سرور (server-sent events) به صورت جریانی به کلاینت ارسال می‌شوند. مقدار پیش‌فرض: false
stream_options	object	تنظیمات مربوط به استریم کردن
tools	one of[]	ابزارهایی برای مدل‌های zhipu که از فراخوانی تابع و جستجوی وب پشتیبانی می‌کنند.
tool_choice	any of	کنترل می‌کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. `none` به این معنی است که مدل هیچ ابزاری را فراخوانی نمی‌کند و به جای آن یک پیام تولید می‌کند. `auto` به این معنی است که مدل می‌تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. `required` به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق `{"type": "function", "function": {"name": "my_function"}}` مدل را مجبور می‌کند تا آن ابزار را فراخوانی کند. `none` مقدار پیش‌فرض زمانی است که هیچ ابزاری وجود نداشته باشد. `auto` مقدار پیش‌فرض در صورت وجود ابزار است. مقادیر مجاز (کلیک برای کپی):
parallel_tool_calls	boolean	فعال کردن فراخوانی موازی تابع در هنگام استفاده از ابزار.
n	integer \| nullable	تعداد انتخاب‌های تکمیل چت که برای هر پیام ورودی باید تولید شود. توجه داشته باشید که هزینه شما بر اساس تعداد توکن‌های تولید شده در تمام انتخاب‌ها محاسبه می‌شود. `n` را روی 1 نگه دارید تا هزینه‌ها به حداقل برسد.
top_p	number	جایگزینی برای نمونه‌برداری با دما، به نام نمونه‌برداری هسته‌ای، که در آن مدل نتایج توکن‌ها را با جرم احتمال top_p در نظر می‌گیرد. بنابراین 0.1 به این معنی است که فقط توکن‌هایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته می‌شوند. به طور کلی توصیه می‌کنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را.
frequency_penalty	number \| nullable	عدد بین -2.0 و 2.0. مقادیر مثبت، توکن‌های جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه می‌کنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش می‌دهند.
presence_penalty	number \| nullable	مقادیر مثبت، توکن‌های جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شده‌اند جریمه می‌کنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش می‌دهند.
response_format	one of	شیئی که فرمت خروجی مدل را مشخص می‌کند.
thinking	object	کنترل اینکه آیا مدل زنجیره تفکر را فعال می‌کند یا خیر. فقط توسط مدل‌های GLM-4.5 و بالاتر پشتیبانی می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation
response = requests.post(
    "https://api.ai-kar.com/v1/chat/completions",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type":"application/json"
    },
    json={
        "model":"zhipu/glm-4.5",
        "messages":[
            {
                "role":"user",
                "content":"Hello"  # insert your prompt here, instead of Hello
            }
        ]
    }
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)

{
  "id": "202508011715489a4cb4a7a145463b",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?</think>"
      }
    }
  ],
  "created": 1754039749,
  "model": "glm-4.5",
  "usage": {
    "completion_tokens": 65,
    "prompt_tokens": 8,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "total_tokens": 73
  },
  "request_id": "202508011715489a4cb4a7a145463b"
}