Embedding Modelsbaai

معرفی و مستندات مدل هوش مصنوعی bge-large-en

مستندات مدل bge-large-en از BAAI، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت ضعیف پشتیبانی می‌کند و بیشتر برای متون انگلیسی طراحی شده است.

مدل BGE-Large-EN-v1.5، مخفف Bi-directional Global Embedding، یک مدل زبانی پیشرفته است که امبدینگ‌های غنی و متنی را برای متن انگلیسی فراهم می‌کند. این مدل اطلاعات زبانی عمیقی را کدگذاری می‌کند و امکان درک جامعی از ظرافت‌های متن را فراهم می‌آورد، که برای وظایف مختلف پردازش زبان طبیعی (NLP) بسیار مهم است. این مدل با درک دو طرفه متن، قادر است روابط بین کلمات و عبارات را به طور موثرتری تشخیص دهد. این ویژگی به ویژه در مواردی که ترتیب کلمات در جمله اهمیت دارد، بسیار مفید است. مدل BGE-Large-EN-v1.5 برای کاربردهایی مانند جستجوی معنایی، خلاصه‌سازی متن، پاسخ به سوالات و تشخیص احساسات مناسب است. با استفاده از این مدل، می‌توان به نتایج دقیق‌تر و قابل اعتمادتری در این زمینه‌ها دست یافت. این مدل با بهره‌گیری از معماری ترانسفورمر، قادر است وابستگی‌های دوربرد بین کلمات را نیز به خوبی مدل‌سازی کند. این امر باعث می‌شود که درک مدل از متن، جامع‌تر و دقیق‌تر باشد. علاوه بر این، مدل BGE-Large-EN-v1.5 با استفاده از تکنیک‌های یادگیری خود نظارتی، بر روی حجم عظیمی از داده‌های متنی آموزش داده شده است. این امر باعث شده است که مدل، دانش زبانی گسترده‌ای را کسب کند و بتواند به خوبی با متون مختلف سازگار شود. در نهایت، مدل BGE-Large-EN-v1.5 یک ابزار قدرتمند برای پردازش زبان طبیعی است که می‌تواند به محققان و توسعه‌دهندگان در حل مسائل مختلف کمک کند. این مدل با ارائه امبدینگ‌های با کیفیت، امکان استفاده از تکنیک‌های یادگیری ماشین را در زمینه‌های مختلف NLP فراهم می‌سازد.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل مورد استفاده برای تولید امبدینگ. مقدار آن باید 'BAAI/bge-large-en-v1.5' باشد.
مقادیر مجاز (کلیک برای کپی):
input
stringRequired
متن ورودی برای تولید امبدینگ. حداقل طول 1 کاراکتر و حداکثر 3000 کاراکتر.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = "https://api.ai-kar.com/v1/embeddings"
headers = {
    "Authorization": "Bearer YOUR_SECRET_TOKEN",
    "Content-Type": "application/json"
}
data = {
    "model": "BAAI/bge-large-en-v1.5",
    "input": "text"
}

response = requests.post(url, headers=headers, data=json.dumps(data))

print(response.status_code)
print(response.text)

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{}