Text Models (LLM)mistral-ai
معرفی و مستندات مدل هوش مصنوعی mistral-tiny
مستندات مدل mistral-tiny ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل mistral-tiny یک مدل زبانی سبک و بهینه شده برای تولید متن کارآمد، خلاصه سازی و تکمیل کد است. این مدل به گونه ای طراحی شده است که به طور موثر در محیط های با منابع محدود عمل کند و در عین حال عملکرد بالایی را حفظ کند. mistral-tiny برای طیف گسترده ای از وظایف پردازش زبان طبیعی (NLP) مناسب است، از جمله تولید متن خلاقانه، پاسخ به سوالات، ترجمه زبان و غیره. این مدل با استفاده از معماری ترانسفورمر آموزش داده شده است و قادر است الگوها و روابط پیچیده را در داده های متنی یاد بگیرد. یکی از ویژگی های کلیدی mistral-tiny، کارایی آن است. این مدل به گونه ای طراحی شده است که با حداقل منابع محاسباتی اجرا شود و آن را برای استفاده در دستگاه های تلفن همراه، سیستم های تعبیه شده و سایر محیط های با منابع محدود ایده آل می کند. با وجود اندازه کوچک، mistral-tiny می تواند عملکرد چشمگیری را در طیف گسترده ای از وظایف NLP ارائه دهد. این مدل قادر است متن منسجم و مرتبط با زمینه را تولید کند، سوالات را با دقت پاسخ دهد و زبان ها را با دقت ترجمه کند. mistral-tiny همچنین برای تکمیل کد مناسب است. این مدل می تواند قطعه کد را بر اساس زمینه ارائه شده تکمیل کند، که می تواند به توسعه دهندگان در صرفه جویی در زمان و تلاش کمک کند. علاوه بر این، mistral-tiny می تواند برای خلاصه سازی متن استفاده شود. این مدل می تواند خلاصه های مختصر و دقیقی از اسناد طولانی تولید کند، که می تواند به کاربران در درک سریع نکات کلیدی یک متن کمک کند. به طور کلی، mistral-tiny یک مدل زبانی قدرتمند و کارآمد است که برای طیف گسترده ای از وظایف NLP مناسب است. اندازه کوچک و عملکرد بالا آن را به گزینه ای ایده آل برای استفاده در محیط های با منابع محدود تبدیل کرده است. این مدل می تواند به توسعه دهندگان و محققان در خودکارسازی وظایف NLP، بهبود دقت و کارایی برنامه های کاربردی و ایجاد محصولات و خدمات جدید کمک کند. این مدل توسط ای آی کار (AI-KAR) در دسترس شما قرار گرفته است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده. مقدار باید 'mistralai/mistral-tiny' باشد. مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیام ها که مکالمه را تا کنون تشکیل می دهند. بسته به مدلی که استفاده می کنید، انواع مختلف پیام ( modalities ) مانند متن، اسناد ( txt, pdf )، تصاویر و صدا پشتیبانی می شوند. |
max_completion_tokens | integer | حد بالایی برای تعداد توکن هایی که می توانند برای تکمیل تولید شوند، از جمله توکن های خروجی قابل مشاهده و توکن های استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکن هایی که می توانند در تکمیل چت تولید شوند. این مقدار می تواند برای کنترل هزینه های متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، داده های پاسخ مدل به صورت جریانی (streaming) با استفاده از رویدادهای ارسال شده از سرور به کلاینت ارسال می شود. |
stream_options | object | تنظیمات مربوط به استریم کردن. |
temperature | number | از چه دمای نمونه برداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفی تر می کند، در حالی که مقادیر پایین تر مانند 0.2 آن را متمرکزتر و قطعی تر می کند. ما به طور کلی توصیه می کنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را. |
top_p | number | جایگزینی برای نمونه برداری با دما، به نام نمونه برداری هسته ای، که در آن مدل نتایج توکن ها را با جرم احتمال top_p در نظر می گیرد. بنابراین 0.1 به این معنی است که فقط توکن هایی که 10٪ جرم احتمال برتر را تشکیل می دهند در نظر گرفته می شوند. ما به طور کلی توصیه می کنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را. حداقل مقدار: 0.01، حداکثر مقدار: 1 |
seed | integer | این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را می کند تا به طور قطعی نمونه برداری کند، به طوری که درخواست های مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند. حداقل مقدار: 1 |
min_p | number | عددی بین 0.001 و 0.999 که می تواند به عنوان جایگزینی برای top_p و top_k استفاده شود. |
top_k | number | فقط از K گزینه برتر برای هر توکن بعدی نمونه برداری کنید. برای حذف پاسخ های "دنباله طولانی" با احتمال کم استفاده می شود. فقط برای موارد استفاده پیشرفته توصیه می شود. معمولاً فقط باید از دما استفاده کنید. |
repetition_penalty | number | nullable | عددی که تنوع متن تولید شده را با کاهش احتمال توالی های تکراری کنترل می کند. مقادیر بالاتر تکرار را کاهش می دهند. |
top_a | number | پارامتر نمونه برداری جایگزین top. |
frequency_penalty | number | nullable | عددی بین -2.0 و 2.0. مقادیر مثبت توکن های جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه می کنند، و احتمال تکرار همان خط را به صورت کلمه به کلمه کاهش می دهند. |
prediction | object | پیکربندی برای خروجی پیش بینی شده، که می تواند زمان پاسخ را در زمانی که بخش های بزرگی از پاسخ مدل از قبل شناخته شده اند، بسیار بهبود بخشد. |
presence_penalty | number | nullable | مقادیر مثبت توکن های جدید را بر اساس اینکه آیا در متن تا کنون ظاهر می شوند جریمه می کنند، و احتمال صحبت مدل در مورد موضوعات جدید را افزایش می دهند. |
tools | object[] | لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان یک ابزار پشتیبانی می شوند. از این برای ارائه لیستی از توابعی که مدل ممکن است ورودی های JSON را برای آنها تولید کند استفاده کنید. حداکثر 128 تابع پشتیبانی می شود. |
tool_choice | any of | کنترل می کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی می شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی کند و در عوض یک پیام تولید می کند. auto به این معنی است که مدل می تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می کند تا آن ابزار را فراخوانی کند. none مقدار پیش فرض است زمانی که هیچ ابزاری وجود ندارد. auto مقدار پیش فرض است اگر ابزارها وجود داشته باشند. مقادیر مجاز (کلیک برای کپی): |
stop | any of | حداکثر 4 دنباله که API تولید توکن های بیشتر را متوقف می کند. متن برگشتی حاوی دنباله توقف نخواهد بود. |
response_format | one of | شیئی که فرمتی را مشخص می کند که مدل باید خروجی دهد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"mistralai/mistral-tiny",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "text",
"object": "text",
"created": 1,
"choices": [
{
"index": 1,
"message": {
"role": "text",
"content": "text",
"refusal": null,
"annotations": [
{
"type": "text",
"url_citation": {
"end_index": 1,
"start_index": 1,
"title": "text",
"url": "text"
}
}
],
"audio": {
"id": "text",
"data": "text",
"transcript": "text",
"expires_at": 1
},
"tool_calls": [
{
"id": "text",
"type": "text",
"function": {
"arguments": "text",
"name": "text"
}
}
]
},
"finish_reason": "stop",
"logprobs": {
"content": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text",
"top_logprobs": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text"
}
]
}
],
"refusal": []
}
}
],
"model": "text",
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 1,
"completion_tokens_details": {
"accepted_prediction_tokens": 1,
"audio_tokens": 1,
"reasoning_tokens": 1,
"rejected_prediction_tokens": 1
},
"prompt_tokens_details": {
"audio_tokens": 1,
"cached_tokens": 1
}
}
}