Embedding Modelsgoogle
معرفی و مستندات مدل هوش مصنوعی text-multilingual-embedding-002
مستندات مدل text-multilingual-embedding-002 ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل text-multilingual-embedding-002 یک مدل پیشرفته است که برای تبدیل دادههای متنی به نمایشهای برداری عددی طراحی شده است. این مدل قادر است معنای ضمنی و مفهوم متن ورودی را درک و استخراج کند. تمرکز ویژه این مدل بر پشتیبانی از زبانهای مختلف است، که آن را برای کاربردهای جهانی بسیار مناسب میسازد. این مدل میتواند در وظایف مختلفی از جمله جستجوی معنایی، تحلیل شباهت متنی، طبقهبندی متون، خوشهبندی، پاسخ به سوالات و اعتبارسنجی حقایق مورد استفاده قرار گیرد. با استفاده از این مدل، میتوان به راحتی متون را به بردارهایی تبدیل کرد که در فضای معنایی مشابه، نزدیک به هم قرار میگیرند. این ویژگی امکان انجام مقایسههای دقیق بین متون مختلف را فراهم میکند. مدل text-multilingual-embedding-002 با بهرهگیری از تکنیکهای پیشرفته یادگیری عمیق، قادر است الگوهای پیچیده زبانی را درک کرده و نمایشهای برداری با کیفیتی تولید کند. این مدل به طور خاص برای پشتیبانی از زبانهای مختلف طراحی شده است، که این امر آن را به یک ابزار قدرتمند برای کاربردهای چند زبانه تبدیل میکند. از جمله کاربردهای این مدل میتوان به بهبود دقت سیستمهای جستجو، افزایش کارایی سیستمهای توصیهگر، و توسعه برنامههای کاربردی هوشمندتر اشاره کرد. همچنین، این مدل میتواند در تحلیل احساسات، خلاصهسازی متون، و ترجمه ماشینی نیز مورد استفاده قرار گیرد. با توجه به قابلیتهای گسترده این مدل، میتوان آن را به عنوان یک ابزار کلیدی در توسعه برنامههای کاربردی هوش مصنوعی در نظر گرفت. این مدل با ارائه نمایشهای برداری دقیق و معنادار از متون، امکان انجام تحلیلهای پیچیده و دستیابی به نتایج دقیقتر را فراهم میکند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدلی که برای تولید امبدینگ استفاده میشود. مقادیر مجاز (کلیک برای کپی): |
input | string | string[]Required | متن ورودی برای تبدیل به امبدینگ، که میتواند به صورت یک رشته یا آرایهای از رشتهها باشد. |
dimensions | number | nullable | تعداد ابعاد بردار امبدینگ خروجی. اگر مشخص نشود، مقدار پیشفرض استفاده میشود. |
auto_truncate | boolean | اگر فعال باشد، متن ورودی به طور خودکار کوتاه میشود تا از حداکثر طول مجاز مدل تجاوز نکند. این کار از بروز خطا جلوگیری میکند. |
task_type | string | نوع وظیفهای که امبدینگ برای آن استفاده خواهد شد. این پارامتر به مدل کمک میکند تا امبدینگهای بهتری تولید کند. مقادیر مجاز (کلیک برای کپی): |
title | string | یک عنوان اختیاری برای متن. فقط زمانی کاربرد دارد که `task_type` برابر با `RETRIEVAL_DOCUMENT` باشد. توجه: تعیین عنوان برای `RETRIEVAL_DOCUMENT` باعث بهبود کیفیت امبدینگها برای بازیابی میشود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
url = "https://api.ai-kar.com/v1/embeddings"
headers = {
"Authorization": "Bearer YOUR_SECRET_TOKEN",
"Content-Type": "application/json"
}
data = {
"model": "text-multilingual-embedding-002",
"input": "text",
"dimensions": 1,
"auto_truncate": True,
"task_type": "RETRIEVAL_QUERY",
"title": "text"
}
response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.status_code)
print(response.text)نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{}