Text Models (LLM)alibaba-cloud

معرفی و مستندات مدل هوش مصنوعی qwen3-coder-480b-a35b-instruct

مستندات مدل qwen3-coder-480b-a35b-instruct ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند و درک نسبی از دستورات و متون فارسی دارد، اما ممکن است در تولید پاسخ‌های پیچیده به زبان فارسی با مشکل مواجه شود.

مدل qwen3-coder-480b-a35b-instruct از مجموعه Qwen3 Coder، یک مدل بسیار قدرتمند با معماری MoE و 480 میلیارد پارامتر است که 35 میلیارد از این پارامترها فعال هستند. این مدل به صورت ذاتی از یک context با طول 256K token پشتیبانی می‌کند و با استفاده از تکنیک‌های extrapolation، قادر به پردازش تا 1 میلیون token نیز می‌باشد. این قابلیت‌ها باعث شده تا مدل در انجام وظایف کدنویسی و agentic عملکرد فوق‌العاده‌ای داشته باشد. این مدل برای توسعه‌دهندگانی طراحی شده که به دنبال یک راهکار هوش مصنوعی قدرتمند برای تولید کد، تکمیل کد، دیباگینگ و سایر وظایف مرتبط با کدنویسی هستند. با توجه به حجم بالای پارامترها و معماری پیشرفته، این مدل قادر است الگوهای پیچیده را در کد تشخیص داده و پیشنهادهای دقیقی ارائه دهد. یکی از ویژگی‌های برجسته این مدل، توانایی بالای آن در درک و تولید کد به زبان‌های مختلف برنامه‌نویسی است. این امر به توسعه‌دهندگان اجازه می‌دهد تا از این مدل در پروژه‌های مختلف با زبان‌های گوناگون بهره ببرند. همچنین، قابلیت پشتیبانی از context طولانی به مدل این امکان را می‌دهد تا درک بهتری از کل پروژه داشته باشد و پیشنهادهای مرتبط‌تری ارائه دهد. برای استفاده از این مدل، ابتدا باید یک حساب کاربری در پلتفرم AI-KAR ایجاد کنید و یک کلید API دریافت نمایید. سپس می‌توانید با استفاده از این کلید، درخواست‌های خود را به مدل ارسال کنید. پارامترهای مختلفی برای کنترل رفتار مدل وجود دارد که می‌توانید بر اساس نیاز خود آن‌ها را تنظیم کنید. به عنوان مثال، می‌توانید حداکثر تعداد توکن‌های تولیدی را محدود کنید یا از تکنیک‌های مختلف sampling برای کنترل تصادفی بودن خروجی استفاده نمایید. مدل qwen3-coder-480b-a35b-instruct یک ابزار قدرتمند برای توسعه‌دهندگان است که می‌تواند به آن‌ها در افزایش سرعت و کیفیت کدنویسی کمک کند. با استفاده از این مدل، می‌توانید وظایف تکراری و زمان‌بر را به صورت خودکار انجام داده و بر روی جنبه‌های خلاقانه‌تر پروژه‌های خود تمرکز کنید. این مدل به ویژه برای پروژه‌های بزرگ و پیچیده که نیاز به درک عمیق از کد دارند، بسیار مناسب است. همچنین، با توجه به قابلیت پشتیبانی از context طولانی، این مدل می‌تواند در پروژه‌هایی که نیاز به حفظ اطلاعات در طولانی مدت دارند، عملکرد بهتری داشته باشد. در نهایت، مدل qwen3-coder-480b-a35b-instruct یک انتخاب عالی برای توسعه‌دهندگانی است که به دنبال یک راهکار هوش مصنوعی پیشرفته برای کدنویسی هستند. با استفاده از این مدل، می‌توانید بهره‌وری خود را افزایش داده و پروژه‌های خود را با کیفیت بالاتری به اتمام برسانید. تیم ای آی کار (AI-KAR) همواره در تلاش است تا بهترین و جدیدترین مدل‌های هوش مصنوعی را در اختیار شما قرار دهد و از شما در مسیر توسعه پروژه‌هایتان حمایت کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده. مقدار این پارامتر باید 'alibaba/qwen3-coder-480b-a35b-instruct' باشد.
مقادیر مجاز (کلیک برای کپی):
messages
one of[]Required
لیستی از پیام‌ها که مکالمه را تا کنون تشکیل داده‌اند. بسته به مدلی که استفاده می‌کنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی می‌شوند.
max_tokens
number
حداکثر تعداد توکن‌هایی که می‌توان در تکمیل چت تولید کرد. این مقدار می‌تواند برای کنترل هزینه‌های متن تولید شده از طریق API استفاده شود.
stream
boolean
اگر روی True تنظیم شود، داده‌های پاسخ مدل به صورت stream و با استفاده از server-sent events به کلاینت ارسال می‌شود.
stream_options
object
تنظیمات مربوط به stream.
tools
object[]
لیستی از ابزارهایی که مدل می‌تواند فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی می‌شوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل می‌تواند ورودی‌های JSON را برای آن‌ها تولید کند. حداکثر 128 تابع پشتیبانی می‌شود.
tool_choice
any of
کنترل می‌کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی‌کند و به جای آن یک پیام تولید می‌کند. auto به این معنی است که مدل می‌تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می‌کند تا آن ابزار را فراخوانی کند.
مقادیر مجاز (کلیک برای کپی):
parallel_tool_calls
boolean
تعیین اینکه آیا فراخوانی موازی توابع در هنگام استفاده از ابزار فعال شود یا خیر.
temperature
number
از چه دمای نمونه‌برداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفی‌تر می‌کنند، در حالی که مقادیر پایین‌تر مانند 0.2 آن را متمرکزتر و قطعی‌تر می‌کنند. به طور کلی توصیه می‌کنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را.
top_p
number
جایگزینی برای نمونه‌برداری با دما، به نام nucleus sampling، که در آن مدل نتایج توکن‌ها را با جرم احتمال top_p در نظر می‌گیرد. بنابراین 0.1 به این معنی است که فقط توکن‌هایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته می‌شوند.
stop
any of
حداکثر 4 دنباله که API تولید توکن‌های بیشتر را متوقف می‌کند. متن برگشتی شامل دنباله توقف نخواهد بود.
frequency_penalty
number
عددی بین -2.0 و 2.0. مقادیر مثبت، توکن‌های جدید را بر اساس فراوانی موجود آن‌ها در متن تا کنون جریمه می‌کنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش می‌دهند.
prediction
object
پیکربندی برای یک خروجی پیش‌بینی‌شده، که می‌تواند زمان پاسخ را در زمانی که بخش‌های بزرگی از پاسخ مدل از قبل مشخص هستند، تا حد زیادی بهبود بخشد.
presence_penalty
number
مقادیر مثبت، توکن‌های جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شده‌اند جریمه می‌کنند، و احتمال صحبت کردن در مورد موضوعات جدید توسط مدل را افزایش می‌دهند.
seed
integer
این ویژگی در حالت بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را می‌کند تا به صورت قطعی نمونه‌برداری کند، به طوری که درخواست‌های مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند.
response_format
one of
شیئی که فرمتی را که مدل باید خروجی دهد مشخص می‌کند.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation
response = requests.post(
    "https://api.ai-kar.com/v1/chat/completions",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type":"application/json"
    },
    json={
        "model":"alibaba/qwen3-coder-480b-a35b-instruct",
        "messages":[
            {
                "role":"user",
                "content":"Hello"  # insert your prompt here, instead of Hello
            }
        ],
        "enable_thinking": False
    }
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "text",
  "object": "text",
  "created": 1,
  "choices": [
    {
      "index": 1,
      "message": {
        "role": "text",
        "content": "text",
        "refusal": null,
        "annotations": [
          {
            "type": "text",
            "url_citation": {
              "end_index": 1,
              "start_index": 1,
              "title": "text",
              "url": "text"
            }
          }
        ],
        "audio": {
          "id": "text",
          "data": "text",
          "transcript": "text",
          "expires_at": 1
        },
        "tool_calls": [
          {
            "id": "text",
            "type": "text",
            "function": {
              "arguments": "text",
              "name": "text"
            }
          }
        ]
      },
      "finish_reason": "stop",
      "logprobs": {
        "content": [
          {
            "bytes": [
              1
            ],
            "logprob": 1,
            "token": "text",
            "top_logprobs": [
              {
                "bytes": [
                  1
                ],
                "logprob": 1,
                "token": "text"
              }
            ]
          }
        ],
        "refusal": []
      }
    }
  ],
  "model": "text",
  "usage": {
    "prompt_tokens": 1,
    "completion_tokens": 1,
    "total_tokens": 1,
    "completion_tokens_details": {
      "accepted_prediction_tokens": 1,
      "audio_tokens": 1,
      "reasoning_tokens": 1,
      "rejected_prediction_tokens": 1
    },
    "prompt_tokens_details": {
      "audio_tokens": 1,
      "cached_tokens": 1
    }
  }
}