Text Models (LLM)alibaba-cloud
معرفی و مستندات مدل هوش مصنوعی qwen3-next-80b-a3b-instruct
مستندات مدل qwen3-next-80b-a3b-instruct ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل qwen3-next-80b-a3b-instruct از alibaba-cloud یک مدل چت آموزشدیده است که برای پاسخهای سریع و پایدار بدون ردیابی استدلال بهینه شده است. این مدل برای انجام وظایف پیچیده در زمینههای استدلال، کدنویسی، پرسش و پاسخ دانش و استفاده چند زبانه طراحی شده و دارای همسویی و قالببندی قوی است. این مدل به طور خاص برای تولید پاسخهای متنی با کیفیت بالا و درک دستورالعملهای پیچیده طراحی شده است. با استفاده از معماری پیشرفته و آموزش گسترده، qwen3-next-80b-a3b-instruct قادر است به سوالات مختلف پاسخ دهد، کد تولید کند، دانش خود را به اشتراک بگذارد و به زبانهای مختلف ارتباط برقرار کند. این مدل به ویژه در مواردی که نیاز به پاسخهای سریع و دقیق بدون نیاز به نمایش مراحل استدلال است، بسیار مفید است. به عنوان مثال، در یک محیط پشتیبانی مشتری، این مدل میتواند به سرعت به سوالات متداول پاسخ دهد و راهنماییهای لازم را ارائه کند. همچنین، در زمینههای آموزشی، این مدل میتواند به عنوان یک معلم خصوصی عمل کرده و به دانشآموزان در یادگیری مفاهیم پیچیده کمک کند. علاوه بر این، qwen3-next-80b-a3b-instruct دارای قابلیتهای چند زبانه است که به آن امکان میدهد با کاربران در سراسر جهان ارتباط برقرار کند. این ویژگی به ویژه برای شرکتهایی که در سطح بینالمللی فعالیت میکنند، بسیار ارزشمند است. در نهایت، این مدل با توجه به همسویی و قالببندی قوی خود، قادر است پاسخهایی را تولید کند که نه تنها دقیق و مرتبط هستند، بلکه از نظر ظاهری نیز جذاب و حرفهای هستند. این امر باعث میشود که کاربران تجربه بهتری از تعامل با این مدل داشته باشند و به آن اعتماد بیشتری کنند. این مدل با استفاده از تکنیکهای پیشرفته یادگیری عمیق آموزش داده شده است تا بتواند الگوهای پیچیده در دادهها را شناسایی کرده و پاسخهای مناسبی را تولید کند. همچنین، این مدل به طور مداوم در حال بهبود است و با استفاده از بازخورد کاربران و دادههای جدید، عملکرد آن به مرور زمان بهبود مییابد. به طور خلاصه، qwen3-next-80b-a3b-instruct یک مدل چت قدرتمند و چند منظوره است که میتواند در زمینههای مختلف مورد استفاده قرار گیرد و به کاربران در انجام وظایف پیچیده کمک کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدلی که میخواهید استفاده کنید. مقدار آن باید 'alibaba/qwen3-next-80b-a3b-instruct' باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا اینجا تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt، pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_completion_tokens | integer | حد بالایی برای تعداد توکنهایی که میتوان برای تکمیل تولید کرد، از جمله توکنهای خروجی قابل مشاهده و توکنهای استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینهها برای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل با استفاده از رویدادهای ارسال شده توسط سرور به صورت جریانی به کلاینت ارسال میشوند. مقدار پیشفرض: false |
stream_options | object | تنظیمات مربوط به استریم کردن |
tools | object[] | لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی میشوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل ممکن است ورودیهای JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی میشود. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و در عوض یک پیام تولید میکند. auto به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور میکند که آن ابزار را فراخوانی کند. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | اینکه آیا فراخوانی موازی تابع در هنگام استفاده از ابزار فعال شود یا خیر. |
temperature | number | از چه دمای نمونهبرداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفیتر میکنند، در حالی که مقادیر پایینتر مانند 0.2 آن را متمرکزتر و قطعیتر میکنند. ما معمولاً توصیه میکنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. ما معمولاً توصیه میکنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را. |
stop | any of | حداکثر 4 دنباله که API تولید توکنهای بیشتر را متوقف میکند. متن بازگشتی شامل دنباله توقف نخواهد بود. |
frequency_penalty | number | عددی بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند، و احتمال تکرار عین به عین یک خط توسط مدل را کاهش میدهند. |
prediction | object | پیکربندی برای یک خروجی پیشبینیشده، که میتواند زمان پاسخ را در زمانی که بخشهای بزرگی از پاسخ مدل از قبل مشخص هستند، به میزان زیادی بهبود بخشد. |
presence_penalty | number | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند یا خیر جریمه میکنند، و احتمال صحبت کردن در مورد موضوعات جدید توسط مدل را افزایش میدهند. |
seed | integer | این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را میکند تا به طور قطعی نمونهبرداری کند، به طوری که درخواستهای مکرر با همان seed و پارامترها باید نتیجه یکسانی را برگردانند. |
response_format | one of | شیئی که فرمتی را مشخص میکند که مدل باید خروجی دهد. |
repetition_penalty | number | عددی که تنوع متن تولید شده را با کاهش احتمال تکرار توالیهای تکراری کنترل میکند. مقادیر بالاتر تکرار را کاهش میدهند. |
logprobs | boolean | اینکه آیا احتمالات لگاریتمی توکنهای خروجی برگردانده شوند یا خیر. اگر True باشد، احتمالات لگاریتمی هر توکن خروجی که در محتوای پیام برگردانده شده است را برمیگرداند. |
top_logprobs | number | یک عدد صحیح بین 0 و 20 که تعداد محتملترین توکنها را برای بازگشت در هر موقعیت توکن مشخص میکند، که هر کدام دارای یک احتمال لگاریتمی مرتبط هستند. اگر این پارامتر استفاده شود، logprobs باید روی True تنظیم شود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"alibaba/qwen3-next-80b-a3b-instruct",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
],
"enable_thinking": False
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "chatcmpl-a944254a-4252-9a54-af1b-94afcfb9807e",
"system_fingerprint": null,
"object": "chat.completion",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"logprobs": null,
"message": {
"role": "assistant",
"content": "Hello! How can I help you today? 😊"
}
}
],
"created": 1758228572,
"model": "qwen3-next-80b-a3b-instruct",
"usage": {
"prompt_tokens": 9,
"completion_tokens": 46,
"total_tokens": 55
}
}