Text Models (LLM)alibaba-cloud
معرفی و مستندات مدل هوش مصنوعی qwen3-coder-480b-a35b-instruct
مستندات مدل qwen3-coder-480b-a35b-instruct ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند و درک نسبی از دستورات و متون فارسی دارد، اما ممکن است در تولید پاسخهای پیچیده به زبان فارسی با مشکل مواجه شود.
مدل qwen3-coder-480b-a35b-instruct از مجموعه Qwen3 Coder، یک مدل بسیار قدرتمند با معماری MoE و 480 میلیارد پارامتر است که 35 میلیارد از این پارامترها فعال هستند. این مدل به صورت ذاتی از یک context با طول 256K token پشتیبانی میکند و با استفاده از تکنیکهای extrapolation، قادر به پردازش تا 1 میلیون token نیز میباشد. این قابلیتها باعث شده تا مدل در انجام وظایف کدنویسی و agentic عملکرد فوقالعادهای داشته باشد.
این مدل برای توسعهدهندگانی طراحی شده که به دنبال یک راهکار هوش مصنوعی قدرتمند برای تولید کد، تکمیل کد، دیباگینگ و سایر وظایف مرتبط با کدنویسی هستند. با توجه به حجم بالای پارامترها و معماری پیشرفته، این مدل قادر است الگوهای پیچیده را در کد تشخیص داده و پیشنهادهای دقیقی ارائه دهد.
یکی از ویژگیهای برجسته این مدل، توانایی بالای آن در درک و تولید کد به زبانهای مختلف برنامهنویسی است. این امر به توسعهدهندگان اجازه میدهد تا از این مدل در پروژههای مختلف با زبانهای گوناگون بهره ببرند. همچنین، قابلیت پشتیبانی از context طولانی به مدل این امکان را میدهد تا درک بهتری از کل پروژه داشته باشد و پیشنهادهای مرتبطتری ارائه دهد.
برای استفاده از این مدل، ابتدا باید یک حساب کاربری در پلتفرم AI-KAR ایجاد کنید و یک کلید API دریافت نمایید. سپس میتوانید با استفاده از این کلید، درخواستهای خود را به مدل ارسال کنید. پارامترهای مختلفی برای کنترل رفتار مدل وجود دارد که میتوانید بر اساس نیاز خود آنها را تنظیم کنید. به عنوان مثال، میتوانید حداکثر تعداد توکنهای تولیدی را محدود کنید یا از تکنیکهای مختلف sampling برای کنترل تصادفی بودن خروجی استفاده نمایید.
مدل qwen3-coder-480b-a35b-instruct یک ابزار قدرتمند برای توسعهدهندگان است که میتواند به آنها در افزایش سرعت و کیفیت کدنویسی کمک کند. با استفاده از این مدل، میتوانید وظایف تکراری و زمانبر را به صورت خودکار انجام داده و بر روی جنبههای خلاقانهتر پروژههای خود تمرکز کنید. این مدل به ویژه برای پروژههای بزرگ و پیچیده که نیاز به درک عمیق از کد دارند، بسیار مناسب است. همچنین، با توجه به قابلیت پشتیبانی از context طولانی، این مدل میتواند در پروژههایی که نیاز به حفظ اطلاعات در طولانی مدت دارند، عملکرد بهتری داشته باشد.
در نهایت، مدل qwen3-coder-480b-a35b-instruct یک انتخاب عالی برای توسعهدهندگانی است که به دنبال یک راهکار هوش مصنوعی پیشرفته برای کدنویسی هستند. با استفاده از این مدل، میتوانید بهرهوری خود را افزایش داده و پروژههای خود را با کیفیت بالاتری به اتمام برسانید. تیم ای آی کار (AI-KAR) همواره در تلاش است تا بهترین و جدیدترین مدلهای هوش مصنوعی را در اختیار شما قرار دهد و از شما در مسیر توسعه پروژههایتان حمایت کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده. مقدار این پارامتر باید 'alibaba/qwen3-coder-480b-a35b-instruct' باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا کنون تشکیل دادهاند. بسته به مدلی که استفاده میکنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینههای متن تولید شده از طریق API استفاده شود. |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل به صورت stream و با استفاده از server-sent events به کلاینت ارسال میشود. |
stream_options | object | تنظیمات مربوط به stream. |
tools | object[] | لیستی از ابزارهایی که مدل میتواند فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی میشوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل میتواند ورودیهای JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی میشود. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و به جای آن یک پیام تولید میکند. auto به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور میکند تا آن ابزار را فراخوانی کند. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | تعیین اینکه آیا فراخوانی موازی توابع در هنگام استفاده از ابزار فعال شود یا خیر. |
temperature | number | از چه دمای نمونهبرداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفیتر میکنند، در حالی که مقادیر پایینتر مانند 0.2 آن را متمرکزتر و قطعیتر میکنند. به طور کلی توصیه میکنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام nucleus sampling، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. |
stop | any of | حداکثر 4 دنباله که API تولید توکنهای بیشتر را متوقف میکند. متن برگشتی شامل دنباله توقف نخواهد بود. |
frequency_penalty | number | عددی بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
prediction | object | پیکربندی برای یک خروجی پیشبینیشده، که میتواند زمان پاسخ را در زمانی که بخشهای بزرگی از پاسخ مدل از قبل مشخص هستند، تا حد زیادی بهبود بخشد. |
presence_penalty | number | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند جریمه میکنند، و احتمال صحبت کردن در مورد موضوعات جدید توسط مدل را افزایش میدهند. |
seed | integer | این ویژگی در حالت بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را میکند تا به صورت قطعی نمونهبرداری کند، به طوری که درخواستهای مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند. |
response_format | one of | شیئی که فرمتی را که مدل باید خروجی دهد مشخص میکند. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"alibaba/qwen3-coder-480b-a35b-instruct",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
],
"enable_thinking": False
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "text",
"object": "text",
"created": 1,
"choices": [
{
"index": 1,
"message": {
"role": "text",
"content": "text",
"refusal": null,
"annotations": [
{
"type": "text",
"url_citation": {
"end_index": 1,
"start_index": 1,
"title": "text",
"url": "text"
}
}
],
"audio": {
"id": "text",
"data": "text",
"transcript": "text",
"expires_at": 1
},
"tool_calls": [
{
"id": "text",
"type": "text",
"function": {
"arguments": "text",
"name": "text"
}
}
]
},
"finish_reason": "stop",
"logprobs": {
"content": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text",
"top_logprobs": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text"
}
]
}
],
"refusal": []
}
}
],
"model": "text",
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 1,
"completion_tokens_details": {
"accepted_prediction_tokens": 1,
"audio_tokens": 1,
"reasoning_tokens": 1,
"rejected_prediction_tokens": 1
},
"prompt_tokens_details": {
"audio_tokens": 1,
"cached_tokens": 1
}
}
}