Vision Modelsocr-optical-character-recognition

معرفی و مستندات مدل هوش مصنوعی Google OCR

مستندات مدل OCR گوگل ارائه شده توسط ای آی کار (AI-KAR)

معرفی و بررسی فنی

⚡ وضعیت پشتیبانی از زبان فارسی

این مدل از زبان فارسی به صورت متوسط پشتیبانی می‌کند و ممکن است در تشخیص متون فارسی با خطاهای جزئی مواجه شود.

مدل OCR گوگل، یک سرویس تشخیص متن قدرتمند است که به شما امکان می‌دهد متن موجود در تصاویر را استخراج و به فرمت قابل ویرایش تبدیل کنید. این مدل با استفاده از پیشرفته‌ترین الگوریتم‌های یادگیری ماشین و بینایی کامپیوتر توسعه یافته است و قادر است متن را از انواع مختلف تصاویر، از جمله اسناد اسکن شده، عکس‌ها، صفحات وب و حتی دست‌نوشته‌ها با دقت بالا تشخیص دهد. این مدل از طریق API ارائه می‌شود و به راحتی می‌توان آن را در برنامه‌ها و سیستم‌های مختلف ادغام کرد. با استفاده از این مدل، می‌توانید فرآیندهای مختلفی مانند ورود داده‌ها، بایگانی اسناد، جستجوی متن در تصاویر و ترجمه متون را به طور خودکار انجام دهید. مدل OCR گوگل از فرمت‌های مختلف تصویر مانند JPEG، PNG، GIF و TIFF پشتیبانی می‌کند و می‌تواند متن را به فرمت‌های مختلفی مانند TXT، PDF و HTML خروجی دهد. این مدل همچنین از قابلیت تشخیص زبان‌های مختلف پشتیبانی می‌کند و می‌تواند متن را به زبان‌های مختلف ترجمه کند. دقت بالای این مدل در تشخیص متن، آن را به یک ابزار ارزشمند برای کسب‌وکارها و سازمان‌هایی تبدیل کرده است که به دنبال خودکارسازی فرآیندهای مبتنی بر متن هستند. با استفاده از این مدل، می‌توانید در زمان و هزینه صرفه‌جویی کنید و بهره‌وری خود را افزایش دهید. این مدل به طور مداوم در حال بهبود است و با اضافه شدن ویژگی‌های جدید، عملکرد آن نیز بهبود می‌یابد. ای آی کار (AI-KAR) این مدل را به صورت یکپارچه در پلتفرم خود ارائه می‌دهد تا کاربران بتوانند به راحتی از آن استفاده کنند. این مدل برای استخراج اطلاعات از تصاویر، خواندن خودکار فاکتورها، تبدیل تصاویر به متن قابل جستجو و بسیاری کاربردهای دیگر مناسب است.

مشخصات فنی (API References)

پارامترنوعتوضیحات و مقادیر
model
stringRequired
نام مدل OCR مورد استفاده. مقدار ثابت: google
مقادیر مجاز (کلیک برای کپی):
image
stringRequired
تصویر ورودی برای تشخیص متن. می‌تواند یک URL یا یک رشته base64 باشد.
language
string
زبان متن موجود در تصویر. در صورت عدم تعیین، به طور خودکار تشخیص داده می‌شود.

نمونه کدهای درخواست

نکته مهم برای توسعه‌دهندگان:

برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.

import requests

url = "https://api.ai-kar.com/v1/ocr"
headers = {"Content-Type": "application/json"}
data = {"model": "google", "image": "[IMAGE_URL_OR_BASE64]", "language": "fa"}

response = requests.post(url, headers=headers, json=data)
print(response.json())

نمونه پاسخ موفق (JSON)

RESPONSE (200 OK)
{
  "status": "success",
  "data": {
    "text": "\u0645\u062a\u0646 \u0627\u0633\u062a\u062e\u0631\u0627\u062c \u0634\u062f\u0647 \u0627\u0632 \u062a\u0635\u0648\u06cc\u0631"
  }
}