Text Models (LLM)alibaba-cloud
معرفی و مستندات مدل هوش مصنوعی qwen-plus
مستندات مدل qwen-plus از Alibaba Cloud، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل qwen-plus یک مدل زبانی بزرگ پیشرفته است که توسط Alibaba Cloud توسعه داده شده است. این مدل با هدف ارائه قابلیتهای پردازش زبان طبیعی (NLP) در سطح بالا طراحی شده و برای انجام طیف گستردهای از وظایف زبانی مناسب است. qwen-plus از چندین زبان از جمله چینی و انگلیسی پشتیبانی میکند و به دلیل تواناییهای استدلال بهبود یافتهاش در انجام وظایف پیچیده، متمایز میشود. این مدل قادر است دستورالعملها را با دقت بیشتری دنبال کند و پاسخهایی منسجم و مرتبط با متن ارائه دهد.
یکی از ویژگیهای برجسته qwen-plus، توانایی آن در درک و تولید متن به زبانهای مختلف است. این ویژگی آن را به ابزاری ارزشمند برای کاربردهایی مانند ترجمه ماشینی، خلاصهسازی متن، تولید محتوا و پاسخ به سوالات تبدیل میکند. مدل qwen-plus با استفاده از معماریهای پیشرفته یادگیری عمیق و با حجم عظیمی از دادههای متنی آموزش داده شده است. این امر به آن امکان میدهد تا الگوهای پیچیده زبانی را یاد بگیرد و درک عمیقی از معنای متن داشته باشد.
علاوه بر این، qwen-plus مجهز به قابلیتهای استدلال منطقی است که به آن اجازه میدهد تا مسائل پیچیده را تحلیل کرده و راهحلهای مناسبی ارائه دهد. این ویژگی به ویژه در کاربردهایی مانند حل مسئله، برنامهریزی و تصمیمگیری مفید است. مدل qwen-plus همچنین قادر است دستورالعملها را به طور دقیق دنبال کند و وظایف مختلف را با توجه به نیازهای کاربر انجام دهد. این ویژگی آن را به ابزاری قدرتمند برای اتوماسیون وظایف و بهبود بهرهوری تبدیل میکند.
به طور خلاصه، qwen-plus یک مدل زبانی بزرگ پیشرفته است که قابلیتهای پردازش زبان طبیعی را در سطح بالایی ارائه میدهد. این مدل با پشتیبانی از چندین زبان، تواناییهای استدلال بهبود یافته و قابلیت دنبال کردن دقیق دستورالعملها، ابزاری ارزشمند برای طیف گستردهای از کاربردها است. از جمله این کاربردها میتوان به ترجمه ماشینی، خلاصهسازی متن، تولید محتوا، پاسخ به سوالات، حل مسئله، برنامهریزی و تصمیمگیری اشاره کرد. ای آی کار (AI-KAR) مفتخر است که این مدل قدرتمند را به کاربران خود ارائه میدهد.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تولید پاسخ. مقدار این فیلد باید alibaba/qwen-plus باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا این لحظه تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلف پیام (modalities) مانند متن، اسناد (txt, pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینههای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل به صورت جریانی (stream) و با استفاده از رویدادهای ارسال شده از سرور (server-sent events) به کلاینت ارسال میشوند. مقدار پیشفرض: false |
stream_options | object | تنظیمات مربوط به جریان داده. |
tools | object[] | لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان ابزار پشتیبانی میشوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل ممکن است ورودیهای JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی میشود. |
tool_choice | any of | کنترل میکند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمیکند و به جای آن یک پیام تولید میکند. auto به این معنی است که مدل میتواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور میکند تا آن ابزار را فراخوانی کند.
none مقدار پیشفرض است زمانی که هیچ ابزاری وجود نداشته باشد. auto مقدار پیشفرض است اگر ابزارها وجود داشته باشند. مقادیر مجاز (کلیک برای کپی): |
parallel_tool_calls | boolean | فعال کردن فراخوانی موازی توابع در هنگام استفاده از ابزار. |
temperature | number | از چه دمای نمونهبرداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفیتر میکنند، در حالی که مقادیر پایینتر مانند 0.2 آن را متمرکزتر و قطعیتر میکنند. به طور کلی توصیه میکنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای (nucleus sampling)، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند.
به طور کلی توصیه میکنیم این مقدار یا temperature را تغییر دهید، اما نه هر دو را. حداقل مقدار: 0.01، حداکثر مقدار: 1 |
stop | any of | حداکثر 4 دنباله که API تولید توکنهای بیشتر را متوقف میکند. متن بازگشتی شامل دنباله توقف نخواهد بود. |
frequency_penalty | number | عددی بین -2.0 و 2.0. مقادیر مثبت، توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
prediction | object | پیکربندی برای یک خروجی پیشبینیشده، که میتواند زمان پاسخ را در زمانی که بخشهای بزرگی از پاسخ مدل از قبل مشخص هستند، تا حد زیادی بهبود بخشد. |
presence_penalty | number | مقادیر مثبت، توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند جریمه میکنند و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش میدهند. |
seed | integer | این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را میکند تا به طور قطعی نمونهبرداری کند، به طوری که درخواستهای مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند. حداقل مقدار: 1 |
response_format | one of | شیئی که فرمتی را مشخص میکند که مدل باید خروجی دهد. |
n | integer | چند انتخاب تکمیل چت برای هر پیام ورودی تولید شود. توجه داشته باشید که هزینه شما بر اساس تعداد توکنهای تولید شده در تمام انتخابها محاسبه میشود. n را روی 1 نگه دارید تا هزینهها به حداقل برسد. |
logprobs | boolean | اینکه آیا احتمال لگاریتمی توکنهای خروجی برگردانده شود یا خیر. اگر True باشد، احتمال لگاریتمی هر توکن خروجی که در محتوای پیام برگردانده شده است را برمیگرداند. |
top_logprobs | number | یک عدد صحیح بین 0 و 20 که تعداد محتملترین توکنها را برای بازگشت در هر موقعیت توکن مشخص میکند، که هر کدام دارای یک احتمال لگاریتمی مرتبط هستند. اگر این پارامتر استفاده شود، logprobs باید روی True تنظیم شود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"qwen-plus",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "text",
"object": "text",
"created": 1,
"choices": [
{
"index": 1,
"message": {
"role": "text",
"content": "text",
"refusal": null,
"annotations": [
{
"type": "text",
"url_citation": {
"end_index": 1,
"start_index": 1,
"title": "text",
"url": "text"
}
}
],
"audio": {
"id": "text",
"data": "text",
"transcript": "text",
"expires_at": 1
},
"tool_calls": [
{
"id": "text",
"type": "text",
"function": {
"arguments": "text",
"name": "text"
}
}
]
},
"finish_reason": "stop",
"logprobs": {
"content": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text",
"top_logprobs": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text"
}
]
}
],
"refusal": []
}
}
],
"model": "text",
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 1,
"completion_tokens_details": {
"accepted_prediction_tokens": 1,
"audio_tokens": 1,
"reasoning_tokens": 1,
"rejected_prediction_tokens": 1
},
"prompt_tokens_details": {
"audio_tokens": 1,
"cached_tokens": 1
}
}
}