Vision Modelsocr-optical-character-recognition
معرفی و مستندات مدل هوش مصنوعی Google OCR
مستندات مدل OCR گوگل ارائه شده توسط ای آی کار (AI-KAR)
معرفی و بررسی فنی
⚡ وضعیت پشتیبانی از زبان فارسی
این مدل از زبان فارسی به صورت متوسط پشتیبانی میکند و ممکن است در تشخیص متون فارسی با خطاهای جزئی مواجه شود.
مدل OCR گوگل، یک سرویس تشخیص متن قدرتمند است که به شما امکان میدهد متن موجود در تصاویر را استخراج و به فرمت قابل ویرایش تبدیل کنید. این مدل با استفاده از پیشرفتهترین الگوریتمهای یادگیری ماشین و بینایی کامپیوتر توسعه یافته است و قادر است متن را از انواع مختلف تصاویر، از جمله اسناد اسکن شده، عکسها، صفحات وب و حتی دستنوشتهها با دقت بالا تشخیص دهد. این مدل از طریق API ارائه میشود و به راحتی میتوان آن را در برنامهها و سیستمهای مختلف ادغام کرد. با استفاده از این مدل، میتوانید فرآیندهای مختلفی مانند ورود دادهها، بایگانی اسناد، جستجوی متن در تصاویر و ترجمه متون را به طور خودکار انجام دهید. مدل OCR گوگل از فرمتهای مختلف تصویر مانند JPEG، PNG، GIF و TIFF پشتیبانی میکند و میتواند متن را به فرمتهای مختلفی مانند TXT، PDF و HTML خروجی دهد. این مدل همچنین از قابلیت تشخیص زبانهای مختلف پشتیبانی میکند و میتواند متن را به زبانهای مختلف ترجمه کند. دقت بالای این مدل در تشخیص متن، آن را به یک ابزار ارزشمند برای کسبوکارها و سازمانهایی تبدیل کرده است که به دنبال خودکارسازی فرآیندهای مبتنی بر متن هستند. با استفاده از این مدل، میتوانید در زمان و هزینه صرفهجویی کنید و بهرهوری خود را افزایش دهید. این مدل به طور مداوم در حال بهبود است و با اضافه شدن ویژگیهای جدید، عملکرد آن نیز بهبود مییابد. ای آی کار (AI-KAR) این مدل را به صورت یکپارچه در پلتفرم خود ارائه میدهد تا کاربران بتوانند به راحتی از آن استفاده کنند. این مدل برای استخراج اطلاعات از تصاویر، خواندن خودکار فاکتورها، تبدیل تصاویر به متن قابل جستجو و بسیاری کاربردهای دیگر مناسب است.
مشخصات فنی (API References)
| پارامتر | نوع | توضیحات و مقادیر |
|---|---|---|
model | stringRequired | نام مدل OCR مورد استفاده. مقدار ثابت: google مقادیر مجاز (کلیک برای کپی): |
image | stringRequired | تصویر ورودی برای تشخیص متن. میتواند یک URL یا یک رشته base64 باشد. |
language | string | زبان متن موجود در تصویر. در صورت عدم تعیین، به طور خودکار تشخیص داده میشود. |
نمونه کدهای درخواست
نکته مهم برای توسعهدهندگان:
برای احراز هویت، حتما کلید API خود را جایگزین YOUR_API_KEY کنید. هدر Authorization الزامی است.
import requests
url = "https://api.ai-kar.com/v1/ocr"
headers = {"Content-Type": "application/json"}
data = {"model": "google", "image": "[IMAGE_URL_OR_BASE64]", "language": "fa"}
response = requests.post(url, headers=headers, json=data)
print(response.json())نمونه پاسخ موفق (JSON)
RESPONSE (200 OK)
{
"status": "success",
"data": {
"text": "\u0645\u062a\u0646 \u0627\u0633\u062a\u062e\u0631\u0627\u062c \u0634\u062f\u0647 \u0627\u0632 \u062a\u0635\u0648\u06cc\u0631"
}
}