Text Models (LLM)google
معرفی و مستندات مدل هوش مصنوعی gemini-2.0-flash-exp
مستندات مدل gemini-2.0-flash-exp ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند.
مدل gemini-2.0-flash-exp یک مدل هوش مصنوعی چندوجهی پیشرفته است که توسط Google DeepMind توسعه داده شده و برای توانمندسازی تجربیات عاملمحور طراحی شده است. این مدل قادر به پردازش متن و تصاویر است و میتواند در طیف گستردهای از کاربردها مورد استفاده قرار گیرد. این مدل به منظور ارائه پاسخهای سریع و کارآمد به سوالات و درخواستهای کاربران طراحی شده است. با استفاده از معماری پیشرفته خود، gemini-2.0-flash-exp میتواند اطلاعات را از منابع مختلف جمعآوری کرده و به شکلی منسجم و قابل فهم ارائه دهد. این مدل برای توسعهدهندگانی که به دنبال ساخت برنامههای کاربردی هوشمند هستند، ابزاری قدرتمند به شمار میرود. از جمله کاربردهای این مدل میتوان به موارد زیر اشاره کرد: پاسخگویی به سوالات، تولید محتوا، خلاصهسازی متون، ترجمه زبانها، تحلیل احساسات، و تشخیص اشیاء در تصاویر. این مدل با بهرهگیری از الگوریتمهای یادگیری عمیق، قادر است الگوهای پیچیده را در دادهها شناسایی کرده و پیشبینیهای دقیقی ارائه دهد. همچنین، gemini-2.0-flash-exp به طور مداوم در حال یادگیری و بهبود است و با گذشت زمان، عملکرد آن بهبود مییابد. این مدل از طریق API قابل دسترس است و توسعهدهندگان میتوانند به راحتی آن را در برنامههای خود ادغام کنند. برای استفاده از این مدل، ابتدا باید یک حساب کاربری در وبسایت ای آی کار (AI-KAR) ایجاد کرده و یک کلید API دریافت کنید. سپس میتوانید با استفاده از کد نمونه ارائه شده، درخواستهای خود را به مدل ارسال کرده و پاسخهای مورد نظر را دریافت کنید. این مدل از پارامترهای مختلفی پشتیبانی میکند که به شما امکان میدهد رفتار آن را تنظیم کنید. به عنوان مثال، میتوانید حداکثر تعداد توکنهای تولید شده، دمای نمونهبرداری، و احتمال هستهای را تعیین کنید. با استفاده از این پارامترها، میتوانید خروجی مدل را بهینه کرده و نتایج دلخواه را به دست آورید. مدل gemini-2.0-flash-exp یک ابزار قدرتمند برای توسعهدهندگان و محققانی است که به دنبال ساخت برنامههای کاربردی هوشمند هستند. این مدل با ارائه عملکرد بالا و انعطافپذیری، میتواند به شما در دستیابی به اهدافتان کمک کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | مدل مورد استفاده برای تکمیل چت. مقادیر مجاز: google/gemini-2.0-flash-exp یا gemini-2.0-flash-exp مقادیر مجاز (کلیک برای کپی): |
messages | one of[]Required | لیستی از پیامها که مکالمه را تا کنون تشکیل میدهند. بسته به مدلی که استفاده میکنید، انواع مختلف پیام (حالتها) مانند متن، اسناد (txt، pdf)، تصاویر و صدا پشتیبانی میشوند. |
max_completion_tokens | integer | حد بالایی برای تعداد توکنهایی که میتوان برای تکمیل تولید کرد، از جمله توکنهای خروجی قابل مشاهده و توکنهای استدلال. حداقل مقدار: 1 |
max_tokens | number | حداکثر تعداد توکنهایی که میتوان در تکمیل چت تولید کرد. این مقدار میتواند برای کنترل هزینهها برای متن تولید شده از طریق API استفاده شود. حداقل مقدار: 1 |
stream | boolean | اگر روی True تنظیم شود، دادههای پاسخ مدل به صورت جریانی با استفاده از رویدادهای ارسال شده توسط سرور به کلاینت ارسال میشوند. مقدار پیشفرض: false |
stream_options | object | گزینههای مربوط به استریم کردن |
n | integer | nullable | چندین انتخاب تکمیل چت برای هر پیام ورودی تولید شود. توجه داشته باشید که بر اساس تعداد توکنهای تولید شده در تمام انتخابها، هزینه دریافت خواهید کرد. برای به حداقل رساندن هزینهها، n را 1 نگه دارید. |
temperature | number | از چه دمای نمونهبرداری استفاده شود. مقادیر بالاتر مانند 0.8 خروجی را تصادفیتر میکنند، در حالی که مقادیر پایینتر مانند 0.2 آن را متمرکزتر و قطعیتر میکنند. ما معمولاً توصیه میکنیم این یا top_p را تغییر دهید، اما نه هر دو. |
top_p | number | جایگزینی برای نمونهبرداری با دما، به نام نمونهبرداری هستهای، که در آن مدل نتایج توکنها را با جرم احتمال top_p در نظر میگیرد. بنابراین 0.1 به این معنی است که فقط توکنهایی که شامل 10٪ جرم احتمال برتر هستند در نظر گرفته میشوند. ما معمولاً توصیه میکنیم این یا دما را تغییر دهید، اما نه هر دو. حداقل مقدار: 0.01، حداکثر مقدار: 1 |
stop | any of | حداکثر 4 دنباله که API تولید توکنهای بیشتر را متوقف میکند. متن بازگشتی شامل دنباله توقف نخواهد بود. |
frequency_penalty | number | nullable | عدد بین -2.0 و 2.0. مقادیر مثبت توکنهای جدید را بر اساس فراوانی موجود آنها در متن تا کنون جریمه میکنند و احتمال تکرار عین به عین همان خط توسط مدل را کاهش میدهند. |
prediction | object | پیکربندی برای یک خروجی پیشبینیشده، که میتواند زمان پاسخ را در زمانی که بخشهای بزرگی از پاسخ مدل از قبل مشخص هستند، تا حد زیادی بهبود بخشد. |
presence_penalty | number | nullable | مقادیر مثبت توکنهای جدید را بر اساس اینکه آیا در متن تا کنون ظاهر شدهاند جریمه میکنند و احتمال صحبت کردن مدل در مورد موضوعات جدید را افزایش میدهند. |
seed | integer | این ویژگی در نسخه بتا است. اگر مشخص شود، سیستم ما تمام تلاش خود را میکند تا به طور قطعی نمونهبرداری کند، به طوری که درخواستهای مکرر با همان seed و پارامترها باید نتیجه یکسانی را برگردانند. حداقل مقدار: 1 |
response_format | one of | شیئی که فرمتی را مشخص میکند که مدل باید خروجی دهد. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json # for getting a structured output with indentation
response = requests.post(
"https://api.ai-kar.com/v1/chat/completions",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization":"Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type":"application/json"
},
json={
"model":"google/gemini-2.0-flash-exp",
"messages":[
{
"role":"user",
"content":"Hello" # insert your prompt here, instead of Hello
}
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"id": "text",
"object": "text",
"created": 1,
"choices": [
{
"index": 1,
"message": {
"role": "text",
"content": "text",
"refusal": null,
"annotations": [
{
"type": "text",
"url_citation": {
"end_index": 1,
"start_index": 1,
"title": "text",
"url": "text"
}
}
],
"audio": {
"id": "text",
"data": "text",
"transcript": "text",
"expires_at": 1
},
"tool_calls": [
{
"id": "text",
"type": "text",
"function": {
"arguments": "text",
"name": "text"
}
}
]
},
"finish_reason": "stop",
"logprobs": {
"content": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text",
"top_logprobs": [
{
"bytes": [
1
],
"logprob": 1,
"token": "text"
}
]
}
],
"refusal": []
}
}
],
"model": "text",
"usage": {
"prompt_tokens": 1,
"completion_tokens": 1,
"total_tokens": 1,
"completion_tokens_details": {
"accepted_prediction_tokens": 1,
"audio_tokens": 1,
"reasoning_tokens": 1,
"rejected_prediction_tokens": 1
},
"prompt_tokens_details": {
"audio_tokens": 1,
"cached_tokens": 1
}
}
}