Text Models (LLM)anthropic

معرفی و مستندات مدل هوش مصنوعی claude-4-sonnet

مستندات مدل claude-4-sonnet از Anthropic، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند. درک نسبتا خوبی از متون فارسی دارد اما ممکن است در تولید متون پیچیده یا تخصصی فارسی با مشکل مواجه شود.

مدل claude-4-sonnet یک پیشرفت چشمگیر نسبت به Claude 3.7 Sonnet است و توانایی‌های کدنویسی بهتر، استدلال قوی‌تر و پاسخ‌های دقیق‌تری به دستورالعمل‌های شما ارائه می‌دهد. این مدل برای طیف گسترده‌ای از وظایف مناسب است، از جمله تولید محتوا، خلاصه‌سازی، ترجمه، پاسخ به سوالات و تولید کد. با استفاده از این مدل، می‌توانید برنامه‌های کاربردی هوش مصنوعی قدرتمندی ایجاد کنید که نیازهای خاص شما را برآورده می‌کنند. این مدل به طور خاص برای ارائه عملکرد بالا در حجم کاری بزرگ سازمانی طراحی شده است. Claude 3 Sonnet دو برابر سریعتر از مدل قبلی خود است و در عین حال سطح هوش بالاتری را حفظ می کند. این مدل برای اتوماسیون وظایف فروش و بازاریابی مانند بهینه سازی محصول، تولید محتوا با کیفیت و پاسخگویی سریع به سوالات مشتریان ایده آل است. همچنین، Claude 3 Sonnet می تواند به عنوان یک همکار برای تحقیق و توسعه، ارائه ایده های جدید و تسریع در فرآیند نوآوری عمل کند. این مدل با درک عمیق تر از دستورالعمل ها و توانایی های استدلال بهبود یافته، می تواند به طور موثرتری به سوالات پیچیده پاسخ دهد و راه حل های خلاقانه ارائه دهد. از دیگر کاربردهای این مدل می توان به موارد زیر اشاره کرد: تولید گزارش های تحلیلی، ایجاد محتوای آموزشی، توسعه بازی های رایانه ای، و تولید موسیقی و هنر. با توجه به سرعت بالا و دقت بالای این مدل، می توانید به طور قابل توجهی در زمان و هزینه های خود صرفه جویی کنید و در عین حال کیفیت خروجی را افزایش دهید. این مدل به طور مداوم در حال بهبود است و با ارائه ویژگی های جدید و به روز رسانی های منظم، همواره در خط مقدم فناوری هوش مصنوعی قرار دارد.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
مدل مورد استفاده برای تکمیل چت. مقادیر ممکن: claude-sonnet-4-20250514, anthropic/claude-sonnet-4, claude-sonnet-4
مقادیر مجاز (کلیک برای کپی):
frequency_penalty
number | nullable
عددی بین -2.0 و 2.0. مقادیر مثبت، توکن‌های جدید را بر اساس فراوانی موجودشان در متن جریمه می‌کنند، در نتیجه احتمال تکرار عین به عین یک خط توسط مدل کاهش می‌یابد.
logit_bias
object | nullable
تغییر احتمال ظاهر شدن توکن‌های مشخص شده در تکمیل. یک شی JSON را می‌پذیرد که توکن‌ها (مشخص شده توسط شناسه توکن آنها در توکنایزر) را به یک مقدار بایاس مرتبط از -100 تا 100 نگاشت می‌کند. از نظر ریاضی، بایاس به logits تولید شده توسط مدل قبل از نمونه‌برداری اضافه می‌شود. اثر دقیق بر اساس مدل متفاوت خواهد بود، اما مقادیر بین -1 و 1 باید احتمال انتخاب را کاهش یا افزایش دهند. مقادیری مانند -100 یا 100 باید منجر به ممنوعیت یا انتخاب انحصاری توکن مربوطه شوند.
logprobs
boolean | nullable
اینکه آیا احتمالات لگاریتمی توکن‌های خروجی برگردانده شوند یا خیر. اگر True باشد، احتمالات لگاریتمی هر توکن خروجی برگردانده شده در محتوای پیام را برمی‌گرداند.
top_logprobs
number | nullable
یک عدد صحیح بین 0 و 20 که تعداد محتمل‌ترین توکن‌ها را برای بازگشت در هر موقعیت توکن مشخص می‌کند، هر کدام با یک احتمال لگاریتمی مرتبط. اگر این پارامتر استفاده شود، logprobs باید روی True تنظیم شود.
max_tokens
number
حداکثر تعداد توکن‌هایی که می‌توان در تکمیل چت تولید کرد. این مقدار می‌تواند برای کنترل هزینه‌های متن تولید شده از طریق API استفاده شود.
max_completion_tokens
integer
حد بالایی برای تعداد توکن هایی که می توانند برای یک تکمیل تولید شوند، از جمله توکن های خروجی قابل مشاهده و توکن های استدلال.
n
integer | nullable
چند انتخاب تکمیل چت برای هر پیام ورودی تولید شود. توجه داشته باشید که هزینه شما بر اساس تعداد توکن های تولید شده در تمام انتخاب ها محاسبه می شود. برای به حداقل رساندن هزینه ها، n را 1 نگه دارید.
prediction
object
پیکربندی برای یک خروجی پیش بینی شده، که می تواند زمان پاسخ را به طور قابل توجهی بهبود بخشد زمانی که بخش های بزرگی از پاسخ مدل از قبل مشخص باشد.
presence_penalty
number | nullable
مقادیر مثبت، توکن‌های جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شده‌اند جریمه می‌کنند، و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش می‌دهند.
seed
integer
این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را می کند تا به طور قطعی نمونه برداری کند، به طوری که درخواست های مکرر با همان seed و پارامترها باید نتیجه یکسانی را برگردانند.
messages
one of[]Required
لیستی از پیام‌هایی که تاکنون مکالمه را تشکیل می‌دهند. بسته به مدلی که استفاده می‌کنید، انواع مختلف پیام ( modalities ) پشتیبانی می‌شوند، مانند متن، اسناد ( txt, pdf )، تصاویر و صدا.
stream
boolean
اگر روی True تنظیم شود، داده‌های پاسخ مدل با استفاده از رویدادهای ارسال شده از سرور، به صورت جریانی به کلاینت ارسال می‌شوند.
stream_options
object
تنظیمات مربوط به استریم کردن
top_p
number
جایگزینی برای نمونه‌برداری با دما، به نام نمونه‌برداری هسته‌ای، که در آن مدل نتایج توکن‌ها را با جرم احتمال top_p در نظر می‌گیرد. بنابراین 0.1 به این معنی است که فقط توکن‌هایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته می‌شوند. ما به طور کلی توصیه می کنیم این یا دما را تغییر دهید، اما نه هر دو.
temperature
number
از چه دمای نمونه برداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفی تر می کند، در حالی که مقادیر پایین تر مانند 0.2 آن را متمرکزتر و قطعی تر می کند. ما به طور کلی توصیه می کنیم این یا top_p را تغییر دهید، اما نه هر دو.
stop
any of
حداکثر 4 دنباله که API تولید توکن های بیشتر را متوقف می کند. متن بازگشتی شامل دنباله توقف نخواهد بود.
tools
object[]
لیستی از ابزارهایی که مدل ممکن است فراخوانی کند. در حال حاضر، فقط توابع به عنوان یک ابزار پشتیبانی می شوند. از این برای ارائه لیستی از توابعی استفاده کنید که مدل ممکن است ورودی های JSON را برای آنها تولید کند. حداکثر 128 تابع پشتیبانی می شود.
tool_choice
any of
کنترل می کند که کدام ابزار (در صورت وجود) توسط مدل فراخوانی می شود. none به این معنی است که مدل هیچ ابزاری را فراخوانی نمی کند و در عوض یک پیام تولید می کند. auto به این معنی است که مدل می تواند بین تولید یک پیام یا فراخوانی یک یا چند ابزار انتخاب کند. required به این معنی است که مدل باید یک یا چند ابزار را فراخوانی کند. تعیین یک ابزار خاص از طریق {"type": "function", "function": {"name": "my_function"}} مدل را مجبور می کند تا آن ابزار را فراخوانی کند. none زمانی پیش فرض است که هیچ ابزاری وجود نداشته باشد. auto در صورت وجود ابزارها پیش فرض است.
مقادیر مجاز (کلیک برای کپی):
parallel_tool_calls
boolean
اینکه آیا فراخوانی تابع موازی در طول استفاده از ابزار فعال شود یا خیر.
reasoning_effort
string · enum
تلاش برای استدلال را برای مدل های استدلال محدود می کند. مقادیر پشتیبانی شده فعلی عبارتند از کم، متوسط و زیاد. کاهش تلاش استدلال می تواند منجر به پاسخ های سریع تر و توکن های کمتری شود که در استدلال در یک پاسخ استفاده می شود.
مقادیر مجاز (کلیک برای کپی):
response_format
one of
شیئی که فرمتی را مشخص می کند که مدل باید خروجی دهد.
audio
object | nullable
پارامترهای خروجی صدا. هنگام درخواست خروجی صدا با modalities: ["audio"] مورد نیاز است.
modalities
string · enum[] | nullable
انواع خروجی که می خواهید مدل تولید کند. اکثر مدل ها قادر به تولید متن هستند که پیش فرض است: ["text"] مدل gpt-4o-audio-preview همچنین می تواند برای تولید صدا استفاده شود. برای درخواست اینکه این مدل هم پاسخ های متنی و هم صوتی تولید کند، می توانید از: ["text", "audio"] استفاده کنید.
web_search_options
object
این ابزار وب را برای نتایج مرتبط برای استفاده در یک پاسخ جستجو می کند.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests
import json

url = 'https://api.ai-kar.com/v1/chat/completions'
headers = {
    'Authorization': 'Bearer <YOUR_AI-KARAPI_KEY>',
    'Content-Type': 'application/json'
}
data = {
    'model': 'anthropic/claude-sonnet-4',
    'messages': [
        {
            'role': 'user',
            'content': 'Hello'
        }
    ]
}
response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json())

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "id": "text",
  "object": "text",
  "created": 1,
  "choices": [
    {
      "index": 1,
      "message": {
        "role": "text",
        "content": "text",
        "refusal": null,
        "annotations": [
          {
            "type": "text",
            "url_citation": {
              "end_index": 1,
              "start_index": 1,
              "title": "text",
              "url": "text"
            }
          }
        ],
        "audio": {
          "id": "text",
          "data": "text",
          "transcript": "text",
          "expires_at": 1
        },
        "tool_calls": [
          {
            "id": "text",
            "type": "text",
            "function": {
              "arguments": "text",
              "name": "text"
            }
          }
        ]
      },
      "finish_reason": "stop",
      "logprobs": {
        "content": [
          {
            "bytes": [
              1
            ],
            "logprob": 1,
            "token": "text",
            "top_logprobs": [
              {
                "bytes": [
                  1
                ],
                "logprob": 1,
                "token": "text"
              }
            ]
          }
        ],
        "refusal": []
      }
    }
  ],
  "model": "text",
  "usage": {
    "prompt_tokens": 1,
    "completion_tokens": 1,
    "total_tokens": 1,
    "completion_tokens_details": {
      "accepted_prediction_tokens": 1,
      "audio_tokens": 1,
      "reasoning_tokens": 1,
      "rejected_prediction_tokens": 1
    },
    "prompt_tokens_details": {
      "audio_tokens": 1,
      "cached_tokens": 1
    }
  }
}