3D-Generating Modelsstability-ai

معرفی و مستندات مدل هوش مصنوعی triposr

مستندات مدل triposr از Stability AI، ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی پشتیبانی نمی‌کند و برای تولید مدل‌های سه بعدی از تصاویر طراحی شده است.

مدل triposr یک مدل مبتنی بر ترنسفورمر است که برای بازسازی سریع اشیاء سه بعدی از یک تصویر RGB طراحی شده است. این مدل قادر است مش‌های سه بعدی با کیفیت بالا را در کمتر از 0.5 ثانیه بر روی یک GPU NVIDIA A100 تولید کند. triposr با استفاده از یک تصویر ورودی، می‌تواند یک مدل سه بعدی از آن شیء را ایجاد کند. این فرآیند شامل تحلیل تصویر، تشخیص ویژگی‌های کلیدی و سپس ساخت یک مدل سه بعدی بر اساس این ویژگی‌ها است. این مدل برای کاربردهایی مانند بازی‌سازی، طراحی محصول، واقعیت افزوده و واقعیت مجازی بسیار مناسب است. با استفاده از triposr، توسعه‌دهندگان و طراحان می‌توانند به سرعت نمونه‌های اولیه سه بعدی از اشیاء را ایجاد کرده و در پروژه‌های خود استفاده کنند. این مدل با سرعت و دقت بالای خود، فرآیند طراحی و توسعه را به طور چشمگیری تسریع می‌بخشد. همچنین، triposr قابلیت حذف پس‌زمینه از تصویر ورودی را دارد که این امکان را فراهم می‌کند تا مدل سه بعدی دقیق‌تری از شیء مورد نظر ایجاد شود. این ویژگی به ویژه در مواردی که پس‌زمینه تصویر پیچیده است یا با شیء مورد نظر تداخل دارد، بسیار مفید است. علاوه بر این، کاربران می‌توانند رزولوشن مش سه بعدی تولید شده را تنظیم کنند تا بین کیفیت و سرعت پردازش تعادل برقرار کنند. به طور کلی، triposr یک ابزار قدرتمند و کارآمد برای بازسازی سه بعدی اشیاء از تصاویر است که می‌تواند در صنایع مختلف مورد استفاده قرار گیرد. این مدل با ارائه سرعت بالا، کیفیت مناسب و قابلیت‌های متنوع، به کاربران امکان می‌دهد تا به راحتی مدل‌های سه بعدی مورد نیاز خود را ایجاد کنند. برای دستیابی به بهترین نتایج، توصیه می‌شود از تصاویر با کیفیت بالا و پس‌زمینه‌های ساده استفاده کنید. همچنین، می‌توانید با تنظیم پارامترهای مختلف مدل، خروجی را بهینه کنید.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل. مقدار آن باید `triposr` باشد.
مقادیر مجاز (کلیک برای کپی):
image_url
stringRequired
آدرس URL تصویر مرجع.
output_format
string
فرمت تصویر تولید شده. مقدار پیش‌فرض `glb` است.
مقادیر مجاز (کلیک برای کپی):
do_remove_background
boolean
فعال کردن حذف پس‌زمینه از تصویر ورودی.
foreground_ratio
number
نسبت تصویر پیش‌زمینه به تصویر اصلی. مقدار پیش‌فرض 0.9 است. حداقل مقدار: 0.5، حداکثر مقدار: 1.
mc_resolution
integer
رزولوشن مکعب‌های متحرک. بالاتر از 512 توصیه نمی‌شود. مقدار پیش‌فرض 256 است. حداقل مقدار: 32، حداکثر مقدار: 1024.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests

def main():
    response = requests.post(
        "https://api.ai-kar.com/v1/images/generations",
        headers={
            # Insert your AI-KAR API Key instead of <YOUR_AI-KARAPI_KEY>:
            "Authorization": "Bearer <YOUR_AI-KARAPI_KEY>",
            "Content-Type": "application/json",
        },
        json={
            "model": "triposr",
            "image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/2/22/Fly_Agaric_mushroom_05.jpg/576px-Fly_Agaric_mushroom_05.jpg",
        },
    )
    response.raise_for_status()
    data = response.json()
    url = data["model_mesh"]["url"]
    file_name = data["model_mesh"]["file_name"]
    mesh_response = requests.get(url, stream=True)
    with open(file_name, "wb") as file:
        for chunk in mesh_response.iter_content(chunk_size=8192):
            file.write(chunk)

if __name__ == "__main__":
    main()

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "status": "text",
  "prompt": [
    "text"
  ],
  "model": "text",
  "model_owner": "text",
  "tags": {
    "ANY_ADDITIONAL_PROPERTY": null
  },
  "num_returns": 1,
  "args": {
    "model": "text",
    "prompt": "text",
    "n": 1,
    "steps": 1,
    "size": "text"
  },
  "subjobs": [],
  "output": {
    "choices": [
      {
        "image_base64": "text"
      }
    ]
  }
}