Image Modelsreve
معرفی و مستندات مدل هوش مصنوعی reve-remix-edit-image
مستندات مدل reve-remix-edit-image از مجموعه مدلهای ای آی کار (AI-KAR).
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند. برای نتایج بهتر، استفاده از prompt های انگلیسی توصیه میشود.
مدل reve-remix-edit-image یک مدل هوش مصنوعی است که برای ترکیب و ویرایش تصاویر طراحی شده است. این مدل به کاربران امکان میدهد تا با ارائه چندین تصویر و یک دستور متنی (prompt)، تصاویر جدید و خلاقانهای ایجاد کنند. به عبارت دیگر، این مدل تصاویر ورودی را بر اساس دستورالعملهای ارائه شده در prompt ترکیب کرده و تغییر میدهد. این مدل میتواند برای تولید تصاویر هنری، ایجاد تغییرات خلاقانه در تصاویر موجود، و یا حتی تولید تصاویر کاملاً جدید با استفاده از عناصر موجود در تصاویر ورودی استفاده شود. کاربران میتوانند تا 4 تصویر را به عنوان ورودی به مدل ارائه دهند و با استفاده از prompt، نحوه ترکیب و ویرایش این تصاویر را تعیین کنند. برای مثال، میتوان دو تصویر را با هم ترکیب کرد و از مدل خواست تا یک شیء خاص را از یک تصویر به تصویر دیگر منتقل کند، یا اینکه یک استایل خاص را از یک تصویر به تصویر دیگر اعمال کند. این مدل از طریق API قابل دسترسی است و کاربران میتوانند با ارسال درخواستهای HTTP به API، تصاویر خود را پردازش کنند. پارامترهای مختلفی برای کنترل نحوه تولید تصویر وجود دارد، از جمله نسبت تصویر (aspect ratio) و فرمت خروجی. همچنین، کاربران میتوانند تعیین کنند که آیا تصویر خروجی به صورت URL ارائه شود یا به صورت کد Base64. این مدل ابزاری قدرتمند برای تولید تصاویر خلاقانه و منحصر به فرد است و میتواند در زمینههای مختلفی مانند طراحی گرافیک، تبلیغات، و هنر دیجیتال مورد استفاده قرار گیرد. با استفاده از این مدل، کاربران میتوانند به سرعت و به آسانی تصاویر جدیدی ایجاد کنند که با استفاده از روشهای سنتی ویرایش تصویر، زمان و تلاش بسیار بیشتری نیاز داشت. این مدل با دریافت تصاویر و یک توضیح متنی، قادر است تا تصاویر جدیدی را تولید کند که ترکیبی از تصاویر ورودی و دستورالعملهای ارائه شده در توضیح متنی باشد. به عنوان مثال، میتوان تصویری از یک منظره طبیعی را با تصویری از یک ساختمان ترکیب کرد و از مدل خواست تا یک منظره شهری با ساختمانهای مدرن ایجاد کند.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. باید `reve/remix-edit-image` باشد. مقادیر مجاز (کلیک برای کپی): |
image_urls | stringRequired | لیستی از URLها یا تصاویر کدگذاری شده Base64 برای ویرایش. حداقل 1 و حداکثر 4 تصویر. |
aspect_ratio | string | نسبت تصویر تولید شده. مقدار پیشفرض `3:2` است. مقادیر مجاز (کلیک برای کپی): |
prompt | stringRequired | توضیح متنی که محتوا، سبک یا ترکیب تصویر تولید شده را توصیف میکند. حداکثر 2560 کاراکتر. |
convert_base64_to_url | boolean | اگر `True` باشد، URL تصویر بازگردانده میشود. در غیر این صورت، فایل به صورت Base64 ارائه میشود. مقدار پیشفرض `true` است. |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض `json` است. مقادیر مجاز (کلیک برای کپی): |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
import json
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "reve/remix-edit-image",
"prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
"image_urls": [
"https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/t-rex.png",
"https://raw.githubusercontent.com/AI-KARapi/api-docs/main/reference-files/blue-mug.jpg"
]
}
)
data = response.json()
print(json.dumps(data, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"data": [
{
"url": "#",
"b64_json": null,
"request_id": "rsid-17c1ade740057a36b9711c72bbf4d63f",
"content_violation": false
}
],
"meta": {
"usage": {
"tokens_used": 210000
}
}
}