Text Models (LLM)zhipu

معرفی و مستندات مدل هوش مصنوعی glm-4.5-air

مستندات مدل glm-4.5-air ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک نسبتا خوبی از دستور زبان فارسی دارد اما ممکن است در تولید متون پیچیده فارسی دچار مشکل شود.

مدل glm-4.5-air یک مدل استدلال ترکیبی است که توسط zhipu توسعه داده شده و در پلتفرم ای آی کار (AI-KAR) ارائه شده است. این مدل دارای دو حالت تفکر است: یک حالت تفکر برای استدلال پیچیده و استفاده از ابزارها، و یک حالت غیر تفکر برای پاسخ‌های فوری. این مدل یک نسخه سبک‌تر از مدل glm-4.5 است و برای کاربردهایی که نیاز به سرعت و کارایی بالا دارند، مناسب است.

glm-4.5-air قادر است وظایف مختلفی را انجام دهد، از جمله پاسخ به سوالات، تولید متن، ترجمه زبان، خلاصه سازی متن، و تولید کد. این مدل به خوبی برای استفاده در چت‌بات‌ها، دستیارهای مجازی، و سایر برنامه‌های کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. حالت تفکر این مدل به آن اجازه می‌دهد تا مسائل پیچیده را حل کند و از ابزارهای مختلف برای کمک به خود استفاده کند. حالت غیر تفکر این مدل به آن اجازه می‌دهد تا به سرعت به سوالات ساده پاسخ دهد و وظایف ساده را انجام دهد.

برای استفاده از این مدل، ابتدا باید یک حساب کاربری در وب‌سایت ای آی کار (AI-KAR) ایجاد کنید و یک کلید API تولید کنید. سپس، می‌توانید از کلید API خود برای ارسال درخواست به API مدل استفاده کنید. API مدل از فرمت JSON برای درخواست‌ها و پاسخ‌ها استفاده می‌کند. برای ارسال یک درخواست، باید یک شی JSON ایجاد کنید که شامل پارامترهای مورد نیاز برای درخواست شما باشد. پارامترهای مورد نیاز شامل مدل، پیام‌ها و سایر پارامترهای اختیاری است. پس از ارسال درخواست، API مدل یک شی JSON را برمی‌گرداند که شامل پاسخ مدل است. پاسخ مدل شامل متن تولید شده توسط مدل، و همچنین اطلاعات دیگری مانند تعداد توکن‌های استفاده شده و دلیل پایان تولید متن است.

این مدل از قابلیت فراخوانی ابزارها (tools) پشتیبانی می‌کند. این قابلیت به مدل اجازه می‌دهد تا در صورت نیاز، از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند. به عنوان مثال، مدل می‌تواند از یک ابزار جستجو برای یافتن اطلاعات در مورد یک موضوع خاص استفاده کند، یا از یک ابزار ترجمه برای ترجمه متن از یک زبان به زبان دیگر. برای استفاده از این قابلیت، باید یک لیست از ابزارهای موجود را به مدل ارائه دهید. هر ابزار باید دارای یک نام، یک توضیحات، و یک طرح JSON باشد که پارامترهای مورد نیاز برای استفاده از ابزار را مشخص می‌کند.

به طور خلاصه، مدل glm-4.5-air یک مدل قدرتمند و کارآمد است که می‌تواند برای طیف گسترده‌ای از وظایف استفاده شود. این مدل به خوبی برای استفاده در چت‌بات‌ها، دستیارهای مجازی، و سایر برنامه‌های کاربردی که نیاز به تعامل با کاربر دارند، مناسب است. با استفاده از قابلیت فراخوانی ابزارها، این مدل می‌تواند به طور خودکار از ابزارهای خارجی برای کمک به انجام وظایف خود استفاده کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تکمیل چت. مقدار باید 'zhipu/glm-4.5-air' باشد.
مقادیر مجاز (کلیک برای کپی):
messages
one of[]Required
لیستی از پیام‌ها که مکالمه را تا به اینجا تشکیل می‌دهند. بسته به مدلی که استفاده می‌کنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی می‌شوند.
max_completion_tokens
integer
حداکثر تعداد توکن‌هایی که می‌توان برای تکمیل تولید کرد، شامل توکن‌های خروجی قابل مشاهده و توکن‌های استدلال. حداقل مقدار: 1
max_tokens
number
حداکثر تعداد توکن‌هایی که می‌توان در تکمیل چت تولید کرد. این مقدار می‌تواند برای کنترل هزینه‌های متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1
stream
boolean
اگر روی True تنظیم شود، داده‌های پاسخ مدل به صورت جریانی با استفاده از رویدادهای ارسال شده توسط سرور به کلاینت ارسال می‌شوند. مقدار پیش‌فرض: false
stream_options
object
تنظیمات مربوط به جریان داده.
tools
object[]
لیستی از ابزارهایی که مدل می‌تواند فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی می‌شوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل می‌تواند ورودی‌های JSON را برای آن‌ها تولید کند. حداکثر 128 تابع پشتیبانی می‌شود.
tool_choice
any of
کنترل می‌کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی‌کند و به جای آن یک پیام تولید می‌کند. auto به این معنی است که مدل می‌تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می‌کند که آن ابزار را فراخوانی کند.
مقادیر مجاز (کلیک برای کپی):
parallel_tool_calls
boolean
تعیین اینکه آیا فراخوانی موازی تابع در هنگام استفاده از ابزار فعال شود یا خیر.
n
integer | nullable
تعداد انتخاب‌های تکمیل چت که برای هر پیام ورودی باید تولید شود. توجه داشته باشید که هزینه بر اساس تعداد توکن‌های تولید شده در تمام انتخاب‌ها محاسبه می‌شود. مقدار n را 1 نگه دارید تا هزینه‌ها به حداقل برسد.
top_p
number
جایگزینی برای نمونه‌برداری با دما، به نام نمونه‌برداری هسته‌ای، که در آن مدل نتایج توکن‌ها را با جرم احتمال top_p در نظر می‌گیرد. بنابراین 0.1 به این معنی است که فقط توکن‌هایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته می‌شوند. به طور کلی توصیه می‌کنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را.
frequency_penalty
number | nullable
عددی بین -2.0 و 2.0. مقادیر مثبت، توکن‌های جدید را بر اساس فراوانی موجود آن‌ها در متن تا به اینجا جریمه می‌کنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش می‌دهند.
presence_penalty
number | nullable
مقادیر مثبت، توکن‌های جدید را بر اساس اینکه آیا در متن تا به اینجا ظاهر شده‌اند یا خیر جریمه می‌کنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش می‌دهند.
response_format
one of
شیئی که فرمتی را مشخص می‌کند که مدل باید خروجی دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation
response = requests.post(
    "https://api.ai-kar.com/v1/chat/completions",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type":"application/json"
    },
    json={
        "model":"zhipu/glm-4.5-air",
        "messages":[
            {
                "role":"user",
                "content":"Hello"  # insert your prompt here, instead of Hello
            }
        ]
    }
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "2025080117263376a343643b35435b",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "message": {
        "role": "assistant",
        "content": "Hello! 👋 How can I assist you today? Feel free to ask any questions or share what you'd like to explore. 😊",
        "reasoning_content": "\nWe are starting with a simple \"Hello\". Since the user just said \"Hello\", we should respond politely and ask how we can help.\n Let's keep it friendly and open-ended."
      }
    }
  ],
  "created": 1754040395,
  "model": "glm-4.5-air",
  "usage": {
    "completion_tokens": 159,
    "prompt_tokens": 3,
    "prompt_tokens_details": {
      "cached_tokens": 4
    },
    "total_tokens": 162
  },
  "request_id": "2025080117263376a343643b35435b"
}