Text Models (LLM)zhipu

معرفی و مستندات مدل هوش مصنوعی glm-4.6

مستندات مدل glm-4.6 ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک و تولید متن فارسی در سطح قابل قبولی انجام می‌شود، اما ممکن است در مواجهه با اصطلاحات تخصصی یا ساختارهای پیچیده زبانی، دقت آن کاهش یابد.

مدل glm-4.6، جدیدترین نسخه از سری مدل‌های GLM، پیشرفت‌های چشمگیری در زمینه‌های کدنویسی، درک متون طولانی، استدلال، بازیابی اطلاعات، نوشتن و کاربردهای مبتنی بر عامل (agent-based applications) ارائه می‌دهد. این مدل با بهره‌گیری از معماری پیشرفته و آموزش بر روی حجم وسیعی از داده‌ها، قادر است وظایف متنوعی را با دقت و کارایی بالا انجام دهد. از جمله قابلیت‌های کلیدی این مدل می‌توان به موارد زیر اشاره کرد:

1. **کدنویسی پیشرفته:** glm-4.6 در تولید و درک کد به زبان‌های مختلف برنامه‌نویسی بسیار توانمند است. این مدل می‌تواند کد را از توضیحات فارسی تولید کند، اشکالات کد موجود را شناسایی و رفع کند، و همچنین کد را به زبان‌های دیگر ترجمه کند. این قابلیت برای توسعه‌دهندگان نرم‌افزار بسیار ارزشمند است و می‌تواند به افزایش سرعت و کیفیت فرآیند توسعه کمک کند.

2. **درک متون طولانی:** این مدل قادر است متون بسیار طولانی را درک کرده و اطلاعات مهم را از آن‌ها استخراج کند. این قابلیت برای تحلیل اسناد، خلاصه سازی متون، و پاسخ به سوالات پیچیده بر اساس محتوای یک متن طولانی بسیار مفید است.

3. **استدلال:** glm-4.6 می‌تواند استدلال منطقی انجام دهد و به سوالات پیچیده با استفاده از اطلاعات موجود پاسخ دهد. این قابلیت برای حل مسائل، تصمیم‌گیری، و ارائه راهکارها در زمینه‌های مختلف کاربرد دارد.

4. **بازیابی اطلاعات:** این مدل می‌تواند اطلاعات مورد نیاز را از منابع مختلف بازیابی کند و به کاربر ارائه دهد. این قابلیت برای جستجوی اطلاعات، پاسخ به سوالات اطلاعاتی، و تولید گزارش‌ها بسیار کارآمد است.

5. **نوشتن:** glm-4.6 می‌تواند متون مختلفی را با سبک‌ها و قالب‌های متفاوت تولید کند. این مدل می‌تواند مقالات، گزارش‌ها، ایمیل‌ها، و سایر انواع متون را با کیفیت بالا تولید کند. این قابلیت برای تولید محتوا، بازاریابی، و ارتباطات بسیار مفید است.

6. **کاربردهای مبتنی بر عامل:** این مدل می‌تواند به عنوان یک عامل هوشمند در سیستم‌های مختلف عمل کند. این عامل می‌تواند با کاربران تعامل داشته باشد، وظایف مختلف را انجام دهد، و به بهبود کارایی سیستم کمک کند. برای مثال، این مدل می‌تواند در سیستم‌های پشتیبانی مشتری، سیستم‌های مدیریت وظایف، و سیستم‌های اتوماسیون اداری مورد استفاده قرار گیرد.

به طور خلاصه، glm-4.6 یک مدل هوش مصنوعی قدرتمند و چندمنظوره است که می‌تواند در زمینه‌های مختلف کاربرد داشته باشد و به بهبود کارایی و کیفیت فرآیندها کمک کند. این مدل با ارائه قابلیت‌های پیشرفته در کدنویسی، درک متون طولانی، استدلال، بازیابی اطلاعات، نوشتن و کاربردهای مبتنی بر عامل، یک ابزار ارزشمند برای توسعه‌دهندگان، محققان، و کسب‌وکارها است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدلی که برای تولید پاسخ استفاده می‌شود.
مقادیر مجاز (کلیک برای کپی):
messages
one of[]Required
لیستی از پیام‌ها که مکالمه را تا به اینجا تشکیل می‌دهند. بسته به مدلی که استفاده می‌کنید، انواع مختلف پیام‌ها (modalities) مانند متن، اسناد (txt، pdf)، تصاویر و صدا پشتیبانی می‌شوند.
max_completion_tokens
integer
حد بالایی برای تعداد توکن‌هایی که می‌توان برای تکمیل تولید کرد، از جمله توکن‌های خروجی قابل مشاهده و توکن‌های استدلال.
max_tokens
number
حداکثر تعداد توکن‌هایی که می‌توان در تکمیل چت تولید کرد. این مقدار می‌تواند برای کنترل هزینه‌های متن تولید شده از طریق API استفاده شود.
stream
boolean
اگر روی True تنظیم شود، داده‌های پاسخ مدل به صورت جریانی با استفاده از رویدادهای ارسال شده توسط سرور (server-sent events) به کلاینت ارسال می‌شوند.
stream_options
object
تنظیمات مربوط به جریان داده.
tools
object[]
لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی می‌شوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل ممکن است ورودی‌های JSON را برای آن‌ها تولید کند. حداکثر 128 تابع پشتیبانی می‌شود.
tool_choice
any of
کنترل می‌کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی‌کند و در عوض یک پیام تولید می‌کند. auto به این معنی است که مدل می‌تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می‌کند که آن ابزار را فراخوانی کند.
مقادیر مجاز (کلیک برای کپی):
parallel_tool_calls
boolean
مشخص می‌کند که آیا فراخوانی همزمان توابع در هنگام استفاده از ابزار فعال شود یا خیر.
n
integer | nullable
تعداد انتخاب‌های تکمیل چت که برای هر پیام ورودی باید تولید شود. توجه داشته باشید که هزینه بر اساس تعداد توکن‌های تولید شده در تمام انتخاب‌ها محاسبه می‌شود. مقدار n را 1 نگه دارید تا هزینه‌ها به حداقل برسد.
top_p
number
جایگزینی برای نمونه‌برداری با دما، به نام نمونه‌برداری هسته‌ای، که در آن مدل نتایج توکن‌ها را با جرم احتمال top_p در نظر می‌گیرد. بنابراین 0.1 به این معنی است که فقط توکن‌هایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته می‌شوند. به طور کلی توصیه می‌کنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را.
frequency_penalty
number | nullable
عددی بین -2.0 و 2.0. مقادیر مثبت، توکن‌های جدید را بر اساس فراوانی موجود آن‌ها در متن تا به اینجا جریمه می‌کنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش می‌دهند.
presence_penalty
number | nullable
مقادیر مثبت، توکن‌های جدید را بر اساس اینکه آیا در متن تا به اینجا ظاهر شده‌اند یا خیر جریمه می‌کنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش می‌دهند.
response_format
one of
شیئی که فرمتی را مشخص می‌کند که مدل باید خروجی دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation
response = requests.post(
    "https://api.ai-kar.com/v1/chat/completions",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type":"application/json"
    },
    json={
        "model":"zhipu/glm-4.6",
        "messages":[
            {
                "role":"user",
                "content":"Hello"  # insert your prompt here, instead of Hello
            }
        ]
    }
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "202508011715489a4cb4a7a145463b",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?</think>"
      }
    }
  ],
  "created": 1754039749,
  "model": "glm-4.5",
  "usage": {
    "completion_tokens": 65,
    "prompt_tokens": 8,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "total_tokens": 73
  },
  "request_id": "202508011715489a4cb4a7a145463b"
}