Text Models (LLM)mistral-ai

معرفی و مستندات مدل هوش مصنوعی mistral-tiny

مستندات مدل mistral-tiny ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند.

مدل mistral-tiny یک مدل زبانی سبک و بهینه شده برای تولید متن کارآمد، خلاصه سازی و تکمیل کد است. این مدل به گونه ای طراحی شده است که به طور موثر در محیط های با منابع محدود عمل کند و در عین حال عملکرد بالایی را حفظ کند. mistral-tiny برای طیف گسترده ای از وظایف پردازش زبان طبیعی (NLP) مناسب است، از جمله تولید متن خلاقانه، پاسخ به سوالات، ترجمه زبان و غیره. این مدل با استفاده از معماری ترانسفورمر آموزش داده شده است و قادر است الگوها و روابط پیچیده را در داده های متنی یاد بگیرد. یکی از ویژگی های کلیدی mistral-tiny، کارایی آن است. این مدل به گونه ای طراحی شده است که با حداقل منابع محاسباتی اجرا شود و آن را برای استفاده در دستگاه های تلفن همراه، سیستم های تعبیه شده و سایر محیط های با منابع محدود ایده آل می کند. با وجود اندازه کوچک، mistral-tiny می تواند عملکرد چشمگیری را در طیف گسترده ای از وظایف NLP ارائه دهد. این مدل قادر است متن منسجم و مرتبط با زمینه را تولید کند، سوالات را با دقت پاسخ دهد و زبان ها را با دقت ترجمه کند. mistral-tiny همچنین برای تکمیل کد مناسب است. این مدل می تواند قطعه کد را بر اساس زمینه ارائه شده تکمیل کند، که می تواند به توسعه دهندگان در صرفه جویی در زمان و تلاش کمک کند. علاوه بر این، mistral-tiny می تواند برای خلاصه سازی متن استفاده شود. این مدل می تواند خلاصه های مختصر و دقیقی از اسناد طولانی تولید کند، که می تواند به کاربران در درک سریع نکات کلیدی یک متن کمک کند. به طور کلی، mistral-tiny یک مدل زبانی قدرتمند و کارآمد است که برای طیف گسترده ای از وظایف NLP مناسب است. اندازه کوچک و عملکرد بالا آن را به گزینه ای ایده آل برای استفاده در محیط های با منابع محدود تبدیل کرده است. این مدل می تواند به توسعه دهندگان و محققان در خودکارسازی وظایف NLP، بهبود دقت و کارایی برنامه های کاربردی و ایجاد محصولات و خدمات جدید کمک کند. این مدل توسط ای آی کار (AI-KAR) در دسترس شما قرار گرفته است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده. مقدار باید 'mistralai/mistral-tiny' باشد.
مقادیر مجاز (کلیک برای کپی):
messages
one of[]Required
لیستی از پیام ها که مکالمه را تا کنون تشکیل می دهند. بسته به مدلی که استفاده می کنید، انواع مختلف پیام ( modalities ) مانند متن، اسناد ( txt, pdf )، تصاویر و صدا پشتیبانی می شوند.
max_completion_tokens
integer
حد بالایی برای تعداد توکن هایی که می توانند برای تکمیل تولید شوند، از جمله توکن های خروجی قابل مشاهده و توکن های استدلال. حداقل مقدار: 1
max_tokens
number
حداکثر تعداد توکن هایی که می توانند در تکمیل چت تولید شوند. این مقدار می تواند برای کنترل هزینه های متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1
stream
boolean
اگر روی True تنظیم شود، داده های پاسخ مدل به صورت جریانی (streaming) با استفاده از رویدادهای ارسال شده از سرور به کلاینت ارسال می شود.
stream_options
object
تنظیمات مربوط به استریم کردن.
temperature
number
از چه دمای نمونه برداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفی تر می کند، در حالی که مقادیر پایین تر مانند 0.2 آن را متمرکزتر و قطعی تر می کند. ما به طور کلی توصیه می کنیم این مقدار یا top_p را تغییر دهید، اما نه هر دو را.
top_p
number
جایگزینی برای نمونه برداری با دما، به نام نمونه برداری هسته ای، که در آن مدل نتایج توکن ها را با جرم احتمال top_p در نظر می گیرد. بنابراین 0.1 به این معنی است که فقط توکن هایی که 10٪ جرم احتمال برتر را تشکیل می دهند در نظر گرفته می شوند. ما به طور کلی توصیه می کنیم این مقدار یا دما را تغییر دهید، اما نه هر دو را. حداقل مقدار: 0.01، حداکثر مقدار: 1
seed
integer
این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را می کند تا به طور قطعی نمونه برداری کند، به طوری که درخواست های مکرر با همان seed و پارامترها باید همان نتیجه را برگردانند. حداقل مقدار: 1
min_p
number
عددی بین 0.001 و 0.999 که می تواند به عنوان جایگزینی برای top_p و top_k استفاده شود.
top_k
number
فقط از K گزینه برتر برای هر توکن بعدی نمونه برداری کنید. برای حذف پاسخ های "دنباله طولانی" با احتمال کم استفاده می شود. فقط برای موارد استفاده پیشرفته توصیه می شود. معمولاً فقط باید از دما استفاده کنید.
repetition_penalty
number | nullable
عددی که تنوع متن تولید شده را با کاهش احتمال توالی های تکراری کنترل می کند. مقادیر بالاتر تکرار را کاهش می دهند.
top_a
number
پارامتر نمونه برداری جایگزین top.
frequency_penalty
number | nullable
عددی بین -2.0 و 2.0. مقادیر مثبت توکن های جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه می کنند، و احتمال تکرار همان خط را به صورت کلمه به کلمه کاهش می دهند.
prediction
object
پیکربندی برای خروجی پیش بینی شده، که می تواند زمان پاسخ را در زمانی که بخش های بزرگی از پاسخ مدل از قبل شناخته شده اند، بسیار بهبود بخشد.
presence_penalty
number | nullable
مقادیر مثبت توکن های جدید را بر اساس اینکه آیا در متن تا کنون ظاهر می شوند جریمه می کنند، و احتمال صحبت مدل در مورد موضوعات جدید را افزایش می دهند.
tools
object[]
لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان یک ابزار پشتیبانی می شوند. از این برای ارائه لیستی از توابعی که مدل ممکن است ورودی های JSON را برای آنها تولید کند استفاده کنید. حداکثر 128 تابع پشتیبانی می شود.
tool_choice
any of
کنترل می کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی می شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی کند و در عوض یک پیام تولید می کند. auto به این معنی است که مدل می تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می کند تا آن ابزار را فراخوانی کند. none مقدار پیش فرض است زمانی که هیچ ابزاری وجود ندارد. auto مقدار پیش فرض است اگر ابزارها وجود داشته باشند.
مقادیر مجاز (کلیک برای کپی):
stop
any of
حداکثر 4 دنباله که API تولید توکن های بیشتر را متوقف می کند. متن برگشتی حاوی دنباله توقف نخواهد بود.
response_format
one of
شیئی که فرمتی را مشخص می کند که مدل باید خروجی دهد.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json  # for getting a structured output with indentation
response = requests.post(
    "https://api.ai-kar.com/v1/chat/completions",
    headers={
        # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
        "Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
        "Content-Type":"application/json"
    },
    json={
        "model":"mistralai/mistral-tiny",
        "messages":[
            {
                "role":"user",
                "content":"Hello"  # insert your prompt here, instead of Hello
            }
        ]
    }
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "text",
  "object": "text",
  "created": 1,
  "choices": [
    {
      "index": 1,
      "message": {
        "role": "text",
        "content": "text",
        "refusal": null,
        "annotations": [
          {
            "type": "text",
            "url_citation": {
              "end_index": 1,
              "start_index": 1,
              "title": "text",
              "url": "text"
            }
          }
        ],
        "audio": {
          "id": "text",
          "data": "text",
          "transcript": "text",
          "expires_at": 1
        },
        "tool_calls": [
          {
            "id": "text",
            "type": "text",
            "function": {
              "arguments": "text",
              "name": "text"
            }
          }
        ]
      },
      "finish_reason": "stop",
      "logprobs": {
        "content": [
          {
            "bytes": [
              1
            ],
            "logprob": 1,
            "token": "text",
            "top_logprobs": [
              {
                "bytes": [
                  1
                ],
                "logprob": 1,
                "token": "text"
              }
            ]
          }
        ],
        "refusal": []
      }
    }
  ],
  "model": "text",
  "usage": {
    "prompt_tokens": 1,
    "completion_tokens": 1,
    "total_tokens": 1,
    "completion_tokens_details": {
      "accepted_prediction_tokens": 1,
      "audio_tokens": 1,
      "reasoning_tokens": 1,
      "rejected_prediction_tokens": 1
    },
    "prompt_tokens_details": {
      "audio_tokens": 1,
      "cached_tokens": 1
    }
  }
}