Embedding Modelsanthropic

معرفی و مستندات مدل هوش مصنوعی voyage-large-2-instruct

مستندات مدل voyage-large-2-instruct از ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند.

مدل voyage-large-2-instruct یک مدل هوش مصنوعی برای تولید امبدینگ متن است که به طور خاص برای وظایفی مانند خوشه‌بندی، طبقه‌بندی و بازیابی اطلاعات بهینه شده است. این مدل به گونه‌ای طراحی شده است که در بنچمارک MTEB (Massive Text Embedding Benchmark) عملکرد فوق‌العاده‌ای داشته باشد و در چندین حوزه کلیدی رتبه اول را کسب کند. این مدل می‌تواند متن ورودی را به یک بردار عددی تبدیل کند که نشان‌دهنده معنای آن متن است. این بردارها می‌توانند برای مقایسه متون مختلف، جستجوی متون مشابه و انجام سایر وظایف پردازش زبان طبیعی استفاده شوند. مدل voyage-large-2-instruct از معماری پیشرفته‌ای بهره می‌برد و با استفاده از داده‌های آموزشی گسترده‌ای آموزش داده شده است. این امر باعث شده است که این مدل در درک و تولید متن بسیار توانمند باشد. از جمله کاربردهای این مدل می‌توان به موارد زیر اشاره کرد:
  • خوشه‌بندی اسناد: گروه‌بندی اسناد مشابه بر اساس محتوای آنها
  • طبقه‌بندی متن: اختصاص دادن یک دسته یا برچسب به یک متن
  • بازیابی اطلاعات: یافتن اسنادی که به یک پرسش خاص مرتبط هستند
  • تولید خلاصه متن: تولید یک خلاصه کوتاه از یک متن طولانی
  • ترجمه ماشینی: ترجمه متن از یک زبان به زبان دیگر
  • پاسخ به سوال: پاسخ دادن به سوالات بر اساس یک متن
برای استفاده از این مدل، شما نیاز به یک کلید API دارید. پس از دریافت کلید API، می‌توانید درخواست‌های خود را به API ارسال کنید و امبدینگ‌های متن مورد نظر خود را دریافت کنید. این مدل به طور مداوم در حال بهبود است و ما در تلاش هستیم تا عملکرد آن را در وظایف مختلف پردازش زبان طبیعی ارتقا دهیم. این مدل برای توسعه‌دهندگان و محققانی که به دنبال یک مدل امبدینگ متن با کیفیت بالا هستند، یک انتخاب عالی است. با استفاده از این مدل، شما می‌توانید به راحتی وظایف مختلف پردازش زبان طبیعی را انجام دهید و نتایج دقیقی را به دست آورید.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تولید امبدینگ. مقدار آن باید 'voyage-large-2-instruct' باشد.
مقادیر مجاز (کلیک برای کپی):
input
string | string[]Required
متن ورودی برای تولید امبدینگ. می‌تواند یک رشته یا آرایه‌ای از رشته‌ها باشد.
input_type
string
نوع داده ورودی برای مدل. مقدار پیش‌فرض 'document' است.
مقادیر مجاز (کلیک برای کپی):

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/embeddings"
headers = {
    "Authorization": "Bearer YOUR_SECRET_TOKEN",
    "Content-Type": "application/json"
}
data = {
    "model": "voyage-large-2-instruct",
    "input": "text",
    "input_type": "document"
}

response = requests.post(url, headers=headers, data=json.dumps(data))

print(response.status_code)
print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "status_code": 201,
  "body": "No content"
}