Text Models (LLM)alibaba-cloud
معرفی و مستندات مدل هوش مصنوعی qwen3-max-instruct
مستندات مدل qwen3-max-instruct از alibaba-cloud، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. درک نسبتا خوبی از دستور زبان فارسی دارد اما ممکن است در تولید متون پیچیده فارسی با مشکل مواجه شود.
مدل qwen3-max-instruct از Alibaba Cloud یک مدل هوش مصنوعی پیشرفته است که برای انجام طیف گستردهای از وظایف طراحی شده است. این مدل با هدف بهبود دقت در زمینههای مختلف از جمله ریاضیات، کدنویسی، منطق و علوم توسعه یافته است. یکی از ویژگیهای برجسته این مدل، توانایی آن در مدیریت دستورالعملهای پیچیده به زبانهای چینی و انگلیسی با قابلیت اطمینان بیشتر است. همچنین، تلاش شده است تا میزان توهمات (hallucinations) در پاسخهای مدل کاهش یابد، که این امر به افزایش دقت و صحت اطلاعات ارائه شده کمک میکند.
این مدل از بیش از 100 زبان پشتیبانی میکند و در ترجمه و استدلالات عقل سلیم (commonsense reasoning) عملکرد قویتری دارد. qwen3-max-instruct به طور خاص برای استفاده در RAG (Retrieval-Augmented Generation) و ابزارهای مختلف بهینهسازی شده است. با این حال، این مدل فاقد حالت 'تفکر' اختصاصی است، به این معنی که فرآیند استدلال داخلی آن به اندازه برخی مدلهای دیگر قابل مشاهده نیست.
به طور خلاصه، qwen3-max-instruct یک ابزار قدرتمند برای توسعهدهندگان و محققانی است که به دنبال یک مدل هوش مصنوعی با قابلیتهای گسترده و عملکرد بالا هستند. این مدل میتواند در زمینههای مختلفی از جمله تولید متن، ترجمه زبان، پاسخ به سوالات و حل مسائل پیچیده مورد استفاده قرار گیرد. با توجه به پشتیبانی از زبانهای متعدد و بهبودهای اعمال شده در دقت و قابلیت اطمینان، qwen3-max-instruct یک گزینه جذاب برای پروژههای هوش مصنوعی متنوع است.
این مدل با در نظر گرفتن نیازهای کاربران در محیطهای مختلف توسعه یافته است و تلاش شده تا استفاده از آن تا حد امکان آسان و کارآمد باشد. با ارائه مستندات جامع و مثالهای کاربردی، توسعهدهندگان میتوانند به سرعت با قابلیتهای این مدل آشنا شده و از آن در پروژههای خود بهره ببرند. ای آی کار (AI-KAR) مفتخر است که این مستندات را برای استفاده بهینه از این مدل قدرتمند ارائه میدهد.
این مدل از بیش از 100 زبان پشتیبانی میکند و در ترجمه و استدلالات عقل سلیم (commonsense reasoning) عملکرد قویتری دارد. qwen3-max-instruct به طور خاص برای استفاده در RAG (Retrieval-Augmented Generation) و ابزارهای مختلف بهینهسازی شده است. با این حال، این مدل فاقد حالت 'تفکر' اختصاصی است، به این معنی که فرآیند استدلال داخلی آن به اندازه برخی مدلهای دیگر قابل مشاهده نیست.
به طور خلاصه، qwen3-max-instruct یک ابزار قدرتمند برای توسعهدهندگان و محققانی است که به دنبال یک مدل هوش مصنوعی با قابلیتهای گسترده و عملکرد بالا هستند. این مدل میتواند در زمینههای مختلفی از جمله تولید متن، ترجمه زبان، پاسخ به سوالات و حل مسائل پیچیده مورد استفاده قرار گیرد. با توجه به پشتیبانی از زبانهای متعدد و بهبودهای اعمال شده در دقت و قابلیت اطمینان، qwen3-max-instruct یک گزینه جذاب برای پروژههای هوش مصنوعی متنوع است.
این مدل با در نظر گرفتن نیازهای کاربران در محیطهای مختلف توسعه یافته است و تلاش شده تا استفاده از آن تا حد امکان آسان و کارآمد باشد. با ارائه مستندات جامع و مثالهای کاربردی، توسعهدهندگان میتوانند به سرعت با قابلیتهای این مدل آشنا شده و از آن در پروژههای خود بهره ببرند. ای آی کار (AI-KAR) مفتخر است که این مستندات را برای استفاده بهینه از این مدل قدرتمند ارائه میدهد.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید پاسخ. مقدار این فیلد باید 'alibaba/qwen3-max-instruct' باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا کنون تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلف پیامها (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_completion_tokens | integer | حد بالایی برای تعداد توکنهایی که میتوان برای تکمیل تولید کرد، شامل توکنهای خروجی قابل مشاهده و توکنهای استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینههای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل به صورت جریانی (streamed) به کلاینت ارسال میشوند، به این صورت که با تولید دادهها توسط سرور، به کلاینت ارسال میشوند. |
stream_options | object | تنظیمات مربوط به جریان داده (streaming). |
tools | object[] | لیستی از ابزارهایی که مدل میتواند فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی میشوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل میتواند ورودیهای JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی میشود. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و به جای آن یک پیام تولید میکند. auto به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور میکند تا آن ابزار را فراخوانی کند. none مقدار پیشفرض است زمانی که هیچ ابزاری وجود نداشته باشد. auto مقدار پیشفرض است اگر ابزارها وجود داشته باشند. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | مشخص میکند که آیا فراخوانی موازی توابع در حین استفاده از ابزار فعال شود یا خیر. |
temperature | number | از چه دمای نمونهبرداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفیتر میکنند، در حالی که مقادیر پایینتر مانند 0.2 آن را متمرکزتر و قطعیتر میکنند. به طور کلی توصیه میکنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای (nucleus sampling)، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. به طور کلی توصیه میکنیم این مقدار یا temperature را تغییر دهید، اما نه هر دو را. |
stop | any of | حداکثر 4 دنباله که API تولید توکنهای بیشتر را متوقف میکند. متن بازگشتی شامل دنباله توقف نخواهد بود. |
frequency_penalty | number | عددی بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند، و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
prediction | object | پیکربندی برای یک خروجی پیشبینیشده، که میتواند زمان پاسخ را در زمانی که بخشهای بزرگی از پاسخ مدل از قبل مشخص هستند، تا حد زیادی بهبود بخشد. |
presence_penalty | number | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند یا خیر، جریمه میکنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش میدهند. |
seed | integer | این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را میکند تا به طور قطعی نمونهبرداری کند، به طوری که درخواستهای مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند. حداقل مقدار: 1 |
response_format | one of | شیئی که فرمتی را مشخص میکند که مدل باید خروجی دهد. |
repetition_penalty | number | عددی که تنوع متن تولید شده را با کاهش احتمال تکرار دنبالههای تکراری کنترل میکند. مقادیر بالاتر تکرار را کاهش میدهند. |
logprobs | boolean | مشخص میکند که آیا احتمالات لگاریتمی (log probabilities) توکنهای خروجی برگردانده شوند یا خیر. اگر True باشد، احتمالات لگاریتمی هر توکن خروجی که در محتوای پیام برگردانده شده است را برمیگرداند. |
top_logprobs | number | یک عدد صحیح بین 0 و 20 که تعداد محتملترین توکنها را برای بازگشت در هر موقعیت توکن مشخص میکند، هر کدام با یک احتمال لگاریتمی مرتبط. اگر این پارامتر استفاده شود، logprobs باید روی True تنظیم شود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"alibaba/qwen3-max-instruct",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
],
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "chatcmpl-bec5dc33-8f63-96b9-89a4-00aecfce7af8",
"system_fingerprint": null,
"object": "chat.completion",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"logprobs": null,
"message": {
"role": "assistant",
"content": "Hello! How can I help you today?"
}
}
],
"created": 1758898624,
"model": "qwen3-max",
"usage": {
"prompt_tokens": 23,
"completion_tokens": 1,
"total_tokens": 24
}
}