Embedding Modelsopenai

معرفی و مستندات مدل هوش مصنوعی text-embedding-3-small

مستندات مدل text-embedding-3-small ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. برای نتایج بهتر، توصیه می‌شود از پیش‌پردازش متن فارسی استفاده شود.

مدل text-embedding-3-small یک مدل کارآمد و فشرده برای تولید امبدینگ‌های متنی است که به منظور بهبود عملکرد نسبت به مدل قبلی خود، text-embedding-ada-002، طراحی شده است. این مدل متن را به نمایش‌های عددی تبدیل می‌کند که به راحتی توسط مدل‌های یادگیری ماشین قابل پردازش هستند. امبدینگ‌های تولید شده توسط این مدل می‌توانند در طیف گسترده‌ای از کاربردها مورد استفاده قرار گیرند، از جمله جستجوی معنایی، خوشه‌بندی اسناد، تشخیص ناهنجاری، و ارزیابی شباهت متن. این مدل با کاهش حجم و افزایش سرعت، امکان استفاده بهینه‌تر از منابع محاسباتی را فراهم می‌کند. از جمله مزایای کلیدی این مدل می‌توان به دقت بالا در تولید امبدینگ‌های با کیفیت، سرعت پردازش سریع‌تر نسبت به مدل‌های بزرگتر، و مصرف بهینه منابع اشاره کرد. این مدل برای توسعه‌دهندگانی که به دنبال یک راه حل کارآمد و مقرون به صرفه برای تولید امبدینگ‌های متنی هستند، بسیار مناسب است. با استفاده از این مدل، می‌توان به راحتی متن را به بردارهای عددی تبدیل کرد و از آنها در انواع مختلف وظایف یادگیری ماشین استفاده نمود. این مدل به ویژه برای کاربردهایی که نیاز به پردازش حجم زیادی از متن دارند، بسیار مناسب است. همچنین، این مدل از نظر حافظه و قدرت پردازشی مورد نیاز، بسیار بهینه‌تر از مدل‌های بزرگتر است، که این امر امکان استفاده از آن را در محیط‌های با منابع محدود فراهم می‌کند. مدل text-embedding-3-small با ارائه یک تعادل مناسب بین دقت، سرعت، و مصرف منابع، یک انتخاب عالی برای توسعه‌دهندگان و محققانی است که به دنبال یک راه حل کارآمد و موثر برای تولید امبدینگ‌های متنی هستند. این مدل با استفاده از الگوریتم‌های پیشرفته و معماری بهینه، قادر است تا امبدینگ‌هایی با کیفیت بالا تولید کند که به خوبی معنای متن را حفظ می‌کنند. این امبدینگ‌ها می‌توانند در انواع مختلف وظایف یادگیری ماشین مورد استفاده قرار گیرند، از جمله طبقه‌بندی متن، خوشه‌بندی متن، و جستجوی معنایی.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدلی که برای تولید امبدینگ استفاده می‌شود.
مقادیر مجاز (کلیک برای کپی):
input
string | string[]Required
متن ورودی برای تولید امبدینگ، که می‌تواند به صورت یک رشته یا آرایه‌ای از رشته‌ها باشد.
encoding_format
string
فرمت خروجی امبدینگ‌ها. اگر مشخص نشود، مقدار پیش‌فرض float است.
مقادیر مجاز (کلیک برای کپی):
dimensions
number
تعداد ابعاد امبدینگ‌های خروجی. اگر مشخص نشود، از مقدار پیش‌فرض استفاده می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/embeddings"
headers = {
    "Authorization": "Bearer YOUR_SECRET_TOKEN",
    "Content-Type": "application/json"
}
data = {
    "model": "text-embedding-3-small",
    "input": "text",
    "encoding_format": "float",
    "dimensions": 1
}

response = requests.post(url, headers=headers, data=json.dumps(data))

print(response.status_code)
print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{}