Embedding Modelsgoogle

معرفی و مستندات مدل هوش مصنوعی text-multilingual-embedding-002

مستندات مدل text-multilingual-embedding-002 ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند.

مدل text-multilingual-embedding-002 یک مدل پیشرفته است که برای تبدیل داده‌های متنی به نمایش‌های برداری عددی طراحی شده است. این مدل قادر است معنای ضمنی و مفهوم متن ورودی را درک و استخراج کند. تمرکز ویژه این مدل بر پشتیبانی از زبان‌های مختلف است، که آن را برای کاربردهای جهانی بسیار مناسب می‌سازد. این مدل می‌تواند در وظایف مختلفی از جمله جستجوی معنایی، تحلیل شباهت متنی، طبقه‌بندی متون، خوشه‌بندی، پاسخ به سوالات و اعتبارسنجی حقایق مورد استفاده قرار گیرد. با استفاده از این مدل، می‌توان به راحتی متون را به بردارهایی تبدیل کرد که در فضای معنایی مشابه، نزدیک به هم قرار می‌گیرند. این ویژگی امکان انجام مقایسه‌های دقیق بین متون مختلف را فراهم می‌کند. مدل text-multilingual-embedding-002 با بهره‌گیری از تکنیک‌های پیشرفته یادگیری عمیق، قادر است الگوهای پیچیده زبانی را درک کرده و نمایش‌های برداری با کیفیتی تولید کند. این مدل به طور خاص برای پشتیبانی از زبان‌های مختلف طراحی شده است، که این امر آن را به یک ابزار قدرتمند برای کاربردهای چند زبانه تبدیل می‌کند. از جمله کاربردهای این مدل می‌توان به بهبود دقت سیستم‌های جستجو، افزایش کارایی سیستم‌های توصیه‌گر، و توسعه برنامه‌های کاربردی هوشمندتر اشاره کرد. همچنین، این مدل می‌تواند در تحلیل احساسات، خلاصه‌سازی متون، و ترجمه ماشینی نیز مورد استفاده قرار گیرد. با توجه به قابلیت‌های گسترده این مدل، می‌توان آن را به عنوان یک ابزار کلیدی در توسعه برنامه‌های کاربردی هوش مصنوعی در نظر گرفت. این مدل با ارائه نمایش‌های برداری دقیق و معنادار از متون، امکان انجام تحلیل‌های پیچیده و دستیابی به نتایج دقیق‌تر را فراهم می‌کند.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدلی که برای تولید امبدینگ استفاده می‌شود.
مقادیر مجاز (کلیک برای کپی):
input
string | string[]Required
متن ورودی برای تبدیل به امبدینگ، که می‌تواند به صورت یک رشته یا آرایه‌ای از رشته‌ها باشد.
dimensions
number | nullable
تعداد ابعاد بردار امبدینگ خروجی. اگر مشخص نشود، مقدار پیش‌فرض استفاده می‌شود.
auto_truncate
boolean
اگر فعال باشد، متن ورودی به طور خودکار کوتاه می‌شود تا از حداکثر طول مجاز مدل تجاوز نکند. این کار از بروز خطا جلوگیری می‌کند.
task_type
string
نوع وظیفه‌ای که امبدینگ برای آن استفاده خواهد شد. این پارامتر به مدل کمک می‌کند تا امبدینگ‌های بهتری تولید کند.
مقادیر مجاز (کلیک برای کپی):
title
string
یک عنوان اختیاری برای متن. فقط زمانی کاربرد دارد که `task_type` برابر با `RETRIEVAL_DOCUMENT` باشد. توجه: تعیین عنوان برای `RETRIEVAL_DOCUMENT` باعث بهبود کیفیت امبدینگ‌ها برای بازیابی می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/embeddings"
headers = {
    "Authorization": "Bearer YOUR_SECRET_TOKEN",
    "Content-Type": "application/json"
}
data = {
    "model": "text-multilingual-embedding-002",
    "input": "text",
    "dimensions": 1,
    "auto_truncate": True,
    "task_type": "RETRIEVAL_QUERY",
    "title": "text"
}

response = requests.post(url, headers=headers, data=json.dumps(data))

print(response.status_code)
print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{}