Embedding Modelsanthropic
معرفی و مستندات مدل هوش مصنوعی voyage-code-2
مدل Embedding تخصصی و قدرتمند voyage-code-2 بهینهشده برای جستجوی معنایی در کد، مخازن گیتهاب و مستندات فنی، ارائه شده توسط ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل برای زبانهای برنامهنویسی بهینه شده است، اما کامنتها و توضیحات فارسی داخل کد را نیز به خوبی پردازش و درک میکند.
مدل voyage-code-2 یک مدل embedding تخصصی است که به طور خاص برای حوزه برنامهنویسی و درک ساختار کد (Code Understanding) طراحی شده است. برخلاف مدلهای متنی معمولی، این مدل بر روی حجم عظیمی از مخازن کد (مانند GitHub) و پرسشوپاسخهای فنی (مانند StackOverflow) آموزش دیده است.
مزیتهای کلیدی:
این مدل در بنچمارکهای جستجوی کد، عملکردی بسیار بالاتر از مدلهای عمومی دارد. voyage-code-2 توانایی درک سینتکس زبانهای برنامهنویسی مختلف (مانند Python, Java, C++, JS و...) را دارد و میتواند ارتباط معنایی بین «یک سوال به زبان طبیعی» و «تکه کد مرتبط» را به خوبی پیدا کند.
کاربردها در ای آی کار (AI-KAR):
اگر در حال ساخت ابزارهایی مانند «جستجوگر کد هوشمند»، «دستیار برنامهنویسی» یا سیستمهای RAG روی مستندات فنی هستید، این مدل بهترین انتخاب است. voyage-code-2 میتواند توابع، کلاسها و قطعه کدهای مشابه را با دقت بالا بازیابی کند و حتی در شناسایی باگها یا کدهای تکراری موثر باشد.
این مدل از پنجره متنی (Context Window) بزرگی پشتیبانی میکند که اجازه میدهد فایلهای کد طولانی را بدون از دست دادن اطلاعات برداری کنید.
مزیتهای کلیدی:
این مدل در بنچمارکهای جستجوی کد، عملکردی بسیار بالاتر از مدلهای عمومی دارد. voyage-code-2 توانایی درک سینتکس زبانهای برنامهنویسی مختلف (مانند Python, Java, C++, JS و...) را دارد و میتواند ارتباط معنایی بین «یک سوال به زبان طبیعی» و «تکه کد مرتبط» را به خوبی پیدا کند.
کاربردها در ای آی کار (AI-KAR):
اگر در حال ساخت ابزارهایی مانند «جستجوگر کد هوشمند»، «دستیار برنامهنویسی» یا سیستمهای RAG روی مستندات فنی هستید، این مدل بهترین انتخاب است. voyage-code-2 میتواند توابع، کلاسها و قطعه کدهای مشابه را با دقت بالا بازیابی کند و حتی در شناسایی باگها یا کدهای تکراری موثر باشد.
این مدل از پنجره متنی (Context Window) بزرگی پشتیبانی میکند که اجازه میدهد فایلهای کد طولانی را بدون از دست دادن اطلاعات برداری کنید.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل (voyage-code-2). مقادیر مجاز (کلیک برای کپی): |
input | string | string[]Required | تکه کد یا متن سوالی که میخواهید امبدینگ آن تولید شود. |
input_type | string | نوع ورودی. برای کوئری جستجو از 'query' و برای ایندکس کردن کدها از 'document' استفاده کنید. مقادیر مجاز (کلیک برای کپی): |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
url = "https://api.ai-kar.com/v1/embeddings"
payload = json.dumps({
"model": "voyage-code-2",
"input": "def calculate_fibonacci(n):",
"input_type": "document"
})
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer YOUR_API_KEY"
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"object": "list",
"data": [
{
"object": "embedding",
"index": 0,
"embedding": [
0.0123,
-0.0456,
0.0789,
"... (1536 dimensions) ..."
]
}
],
"model": "voyage-code-2",
"usage": {
"prompt_tokens": 12,
"total_tokens": 12
}
}