3D-Generating Modelsstability-ai
معرفی و مستندات مدل هوش مصنوعی triposr
مستندات مدل triposr از Stability AI، ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی پشتیبانی نمیکند و برای تولید مدلهای سه بعدی از تصاویر طراحی شده است.
مدل triposr یک مدل مبتنی بر ترنسفورمر است که برای بازسازی سریع اشیاء سه بعدی از یک تصویر RGB طراحی شده است. این مدل قادر است مشهای سه بعدی با کیفیت بالا را در کمتر از 0.5 ثانیه بر روی یک GPU NVIDIA A100 تولید کند. triposr با استفاده از یک تصویر ورودی، میتواند یک مدل سه بعدی از آن شیء را ایجاد کند. این فرآیند شامل تحلیل تصویر، تشخیص ویژگیهای کلیدی و سپس ساخت یک مدل سه بعدی بر اساس این ویژگیها است. این مدل برای کاربردهایی مانند بازیسازی، طراحی محصول، واقعیت افزوده و واقعیت مجازی بسیار مناسب است. با استفاده از triposr، توسعهدهندگان و طراحان میتوانند به سرعت نمونههای اولیه سه بعدی از اشیاء را ایجاد کرده و در پروژههای خود استفاده کنند. این مدل با سرعت و دقت بالای خود، فرآیند طراحی و توسعه را به طور چشمگیری تسریع میبخشد. همچنین، triposr قابلیت حذف پسزمینه از تصویر ورودی را دارد که این امکان را فراهم میکند تا مدل سه بعدی دقیقتری از شیء مورد نظر ایجاد شود. این ویژگی به ویژه در مواردی که پسزمینه تصویر پیچیده است یا با شیء مورد نظر تداخل دارد، بسیار مفید است. علاوه بر این، کاربران میتوانند رزولوشن مش سه بعدی تولید شده را تنظیم کنند تا بین کیفیت و سرعت پردازش تعادل برقرار کنند. به طور کلی، triposr یک ابزار قدرتمند و کارآمد برای بازسازی سه بعدی اشیاء از تصاویر است که میتواند در صنایع مختلف مورد استفاده قرار گیرد. این مدل با ارائه سرعت بالا، کیفیت مناسب و قابلیتهای متنوع، به کاربران امکان میدهد تا به راحتی مدلهای سه بعدی مورد نیاز خود را ایجاد کنند. برای دستیابی به بهترین نتایج، توصیه میشود از تصاویر با کیفیت بالا و پسزمینههای ساده استفاده کنید. همچنین، میتوانید با تنظیم پارامترهای مختلف مدل، خروجی را بهینه کنید.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل. مقدار آن باید `triposr` باشد. مقادیر مجاز (کلیک برای کپی): |
image_url | stringRequired | آدرس URL تصویر مرجع. |
output_format | string | فرمت تصویر تولید شده. مقدار پیشفرض `glb` است. مقادیر مجاز (کلیک برای کپی): |
do_remove_background | boolean | فعال کردن حذف پسزمینه از تصویر ورودی. |
foreground_ratio | number | نسبت تصویر پیشزمینه به تصویر اصلی. مقدار پیشفرض 0.9 است. حداقل مقدار: 0.5، حداکثر مقدار: 1. |
mc_resolution | integer | رزولوشن مکعبهای متحرک. بالاتر از 512 توصیه نمیشود. مقدار پیشفرض 256 است. حداقل مقدار: 32، حداکثر مقدار: 1024. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
def main():
response = requests.post(
"https://api.ai-kar.com/v1/images/generations",
headers={
# Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
"Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
"Content-Type": "application/json",
},
json={
"model": "triposr",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/2/22/Fly_Agaric_mushroom_05.jpg/576px-Fly_Agaric_mushroom_05.jpg",
},
)
response.raise_for_status()
data = response.json()
url = data["model_mesh"]["url"]
file_name = data["model_mesh"]["file_name"]
mesh_response = requests.get(url, stream=True)
with open(file_name, "wb") as file:
for chunk in mesh_response.iter_content(chunk_size=8192):
file.write(chunk)
if __name__ == "__main__":
main()نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"status": "text",
"prompt": [
"text"
],
"model": "text",
"model_owner": "text",
"tags": {
"ANY_ADDITIONAL_PROPERTY": null
},
"num_returns": 1,
"args": {
"model": "text",
"prompt": "text",
"n": 1,
"steps": 1,
"size": "text"
},
"subjobs": [],
"output": {
"choices": [
{
"image_base64": "text"
}
]
}
}