مستندات تصویری خود را به کمک فناوری OCR ذخیره کنید

ثبت و بایگانی اسناد و مستندات در سازمان‌های بزرگ، کاری زمان‌بر و مهم محسوب می‌گردد. در همین راستا شرکت‌ها و سازمان‌های بزرگ از نرم افزار بایگانی اسناد یا همان مدیریت مستندات (DMS) استفاده می‌نمایند، تا قادر به دسته‌بندی بهتر اسناد و همچنین جستجو در بین آنها باشند.
تصویر مستندات تصویری خود را به کمک فناوری OCR ذخیره کنید

به گزارش سایت خبری پرسون، ثبت و بایگانی اسناد و مستندات در سازمان‌های بزرگ، کاری زمان‌بر و مهم محسوب می‌گردد. در همین راستا شرکت‌ها و سازمان‌های بزرگ از نرم افزار بایگانی اسناد یا همان مدیریت مستندات (DMS) استفاده می‌نمایند، تا قادر به دسته‌بندی بهتر اسناد و همچنین جستجو در بین آنها باشند.

اما هنوز مشکلات و کمبود‌هایی وجود دارد؛ زیرا برخی از اسناد و مدارک وارده به سامانه‌های آرشیو اسناد، به صورت عکس هستند و متن درون آنها قابل جستجو یا ویرایش نیست و افراد برای استفاده از متن آن‌ها و یا جستجو در بین آن‌ها، باید به صورت دستی، متن درون اسناد تصویری را تایپ کنند، که کاری بسیار زمان‌بر محسوب می‌گردد.

برخی از سامانه‌های آرشیو اسناد برای رفع این مشکل، از فناوری جدیدی به نام OCR استفاده می‌کنند؛ اما تکنولوژی OCR چیست؟ فناوری OCR چه کاربردی در نرم افزار بایگانی اسناد دارد؟ برای پاسخ به این سوالات، تا انتهای این مقاله از پرسون همراه ما باشید.

فناوری OCR چیست؟

OCR چیست؟ OCR مخفف عبارت Optical Character Recognition به معنای «تشخیص کاراکتر نوری» است و هدف آن، شناسایی کاراکتر‌های نوشتاری موجود در تصاویر و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه‌ها می‌باشد.

به بیان دیگر، به کمک فناوری OCR می‌توان متن نامه‌ها و اسنادی را که به صورت تصویری ثبت شده‌اند، به فایل‌های قابل ویرایش (مانند فایل Word) تبدیل نمود. شایان ذکر است که انواع مختلفی از فناوری‌های OCR وجود دارند، که هر کدام از آنها به روش خاص خود، کاراکترهای نوشتاری درون تصاویر را شناسایی می‌نمایند و به فایل‌های قابل ویرایش در کامپیوترها، تبدیل می‌کنند. انواع فناوری‌های OCR عبارت‌اند از:

تشخیص هوشمند کلمه (Intelligent Word Recognition)

در این نوع از فناوری OCR، سیستم به جای شناسایی کاراکترهای تکی، کلمات را به صورت کامل شناسایی می‌کند؛ از این فناوری می‌توان برای شناسایی و تبدیل متون دست‌نویس درون تصاویر استفاده کرد.

تشخیص کاراکتر هوشمند (Intelligent Character Recognition)

این فناوری نیز قابلیت شناسایی متون دست‌نویس و شکسته را دارد، اما بر خلاف مورد قبلی، در این نوع از OCR، به جای شناسایی کلمات به صورت کامل، حروف را به صورت تک تک شناسایی می‌کند و در نهایت با کنار هم قرار دادن آنها به ترتیب شناسایی، کلمات را تشخیص می‌دهد؛ شایان ذکر است که این فناوری به کمک قابلیت یادگیری ماشین (Machine Learning) تکامل و بهبود می‌یابد.

تشخیص نوری کلمه (Optical Word Recognition)

فناوری تشخیص نوری کلمه، برای شناسایی متون تایپ شده در تصاویر طراحی شد و توسعه پیدا کرد؛ این نوع از OCR متن تایپ شده را به صورت کلمه‌های مورد هدف قرار می‌دهد و آن را به متون قابل جستجو و ویرایش در کامپیوترها تبدیل می‌کند.

تشخیص کاراکتر نوری (Optical Character Recognition)

در این نوع از قابلیت OCR، همانند مورد قبلی متون تایپ شده در تصاویر شناسایی می‌شوند، با این تفاوت که در این فناوری، تک تک کاراکتر‌ها به صورت مجزا شناسایی می‌شوند و در نهایت در کنار یکدیگر قرار می‌گیرند.

تشخیص علامت نوری (Optical Mark Recognition)

قابلیت و فناوری تشخیص علامت نوری با هدف شناسایی علائم نوشته شده به دست انسان و تبدیل آنها به متون قابل ویرایش در کامپیوترها است؛ این متون ممکن است عددی و یا نوشتاری باشند.

مراحل کار نرم افزار OCR

همان‌طور که مطالعه کردیم، فناوری OCR دارای انواع مختلفی است که به کمک آنها می‌توان هر نوع سند تصویری که دارای کاراکتر‌ها یا علائم نوشتاری است را به متونی قابل جستجو و ویرایش در کامپیوتر تبدیل نمود. حال این قابلیت و فناوری چه کاربرد‌هایی در سامانه‌ها و نرم‌افزارها دارد؟

تکنولوژی OCR چه کاربردهایی دارد؟

از فناوری OCR می‌توان در سامانه‌ها، نرم‌افزارها و ابزارهای مختلفی استفاده نمود؛ برخی از کاربرد‌های فناوری OCR عبارت‌اند از:

  • تولید نرم‌افزارهای پلاک‌خوان
  • تبدیل تصاویر اسناد به متن، مانند تبدیل کتاب‌های چاپی به نسخه‌های الکترونیکی قابل ویرایش.
  • تبدیل انواع رسید مالی به اسناد قابل ویرایش
  • تولید ابزار جستجوی متون در تصاویر
  • تولید ابزار شناسایی و ترجمه متون درون تصاویر
  • تبدیل فایل‌های PDF به متن
  • و...

کاربرد OCR در نرم افزار بایگانی اسناد چیست؟

با استفاده از فناوری OCR در نرم افزارهای بایگانی و آرشیو اسناد و مدیریت مستندات، فرآیند تبدیل تصویر (اسناد تصویری دارای متن) به متون قابل ویرایش و جستجو، در زمانی بسیار کم و با هزینه‌ای بسیار پایین صورت می‌گیرد؛ به بیان دیگر، کاربران با استفاده از قابلیت OCR، بدون نیاز به تایپ و در کمترین زمان ممکن، قادر به تبدیل اسناد تصویری خود، به اسناد متنی قابل ویرایش و جستجو می‌باشند

انواع مختلفی از نرم افزارهای مدیریت مستندات و آرشیو اسناد وجود دارند، اما تنها برخی از آنها دارای فناوری OCR هستند و یکی از بهترین نرم افزارهای آرشیو و بایگانی که دارای قابلیت OCR هم است، نرم افزار بایگانی اسناد فراگستر می‌باشد.

این نرم‌افزار یکی از زیرسیستم‌های اتوماسیون اداری فراگستر است. نرم افزار بایگانی اسناد فراگستر با استفاده از فناوری OCR، قادر به شناسایی متون فارسی در انواع تصاویر اسکن شده، تصاویر دریافتی از درگاه‌های مختلف (مانند درگاه‌های فکس، ایمیل، ECE) و سامانه‌های مختلف (مانند پیشخوان خدمت) می‌باشد.

قابلیت OCR فارسی فراگستر، کاربرد‌ها و مزایای گوناگونی در نرم افزار مدیریت مستندات دارد، که برخی از آنها عبارت‌اند از:

  • افزایش دقت بازشناسی اسناد
  • استخراج متن از انواع فرمت‌ تصاویر (مانند BMP، JPG، PDF، PNG و TIFF)
  • پشتیبانی کامل از زبان‌های فارسی و انگلیسی
  • تشخیص خودکار متن، گرافیک، جدول و اعداد در تصاویر
  • پشتیبانی از انواع فونت‌های مرسوم و پرکاربرد در سازمان‌ها (مانند نازنین، میترا، زر، لوتوس، یاقوت، هما، تیتر، ترافیک، تایمز و تاهما)
  • انجام فرآیند موازی OCR جهت کاهش زمان اجرای فرآیند شناسایی متون
  • و...

با استفاده از فناوری OCR در نرم افزار بایگانی اسناد فراگستر، در کمترین زمان و با بالاترین دقت، قادر به تبدیل تصاویر حاوی نوشته، به فایل‌های متنی قابل ویرایش و جستجو می‌باشید.

یکی از مهم‌ترین ویژگی‌های OCR فراگستر، پشتیبانی آن از زبان فارسی است؛ زیرا متون فارسی به دلیل رسم‌الخط این زبان، به راحتی قابل تشخیص نیستند و از طرفی متون فارسی تایپ شده هم دارای فونت‌های گوناگونی می‌باشند که در فرآیند تشخیص آنها توسط OCR، اختلال ایجاد می‌کند. مراحل کار قابلیت OCR در نرم افزار بایگانی فراگستر، مطابق تصویر زیر می‌باشد:

لازم به ذکر است که نرم افزار مدیریت و بایگانی مستندات فراگستر، علاوه بر قابلیت OCR فارسی، دارای ویژگی‌ها و کاربردهای دیگری هم هست، که برخی از آنها عبارت‌اند از:

  • قابلیت تعریف، ثبت و گردش انواع اسناد (مانند اسناد ایزو، اداری-ستادی، مهندسی، مالی، منابع انسانی، فنی و پروژه‌ها و...)
  • قابلیت یکپارچگی با نرم‌افزارهای خانواده Office
  • قابلیت ایجاد ارتباط یک نامه به یک سند از کارتابل اتوماسیون اداری
  • امکان تعریف و گردش فرم‌های اطلاعاتی (Enterprise Form Generator)
  • پشتیبانی کامل از قابلیت OCR فارسی (فراهم کردن امکان جستجو و بازیابی اسناد)
  • قابلیت کاهش نویز تصاویر اسکن شده (کاهش حجم ترافیک شبکه و افزایش سرعت دسترس‌پذیری اسناد)
  • قابلیت کتابخانه اسناد (امکان تعریف دسته‌بندی‌های درختواره‌ای، امکان تعریف سطوح دسترسی و...)
  • قابلیت جستجوی پیشرفته (جستجو داخل متن مستندات و فایل‌های Word، PDF و Excel)

همانطور که در این مقاله آشنا شدید، با فناوری OCR در داخل نرم افزار مدیریت مستندات فراگستر می‌توانید مستندات تصویری مانند فاکتورها، قراردادها، سند‌های بانکی و ... را به راحتی و با سرعت بالا تشخیص داده و به صورت الکترونیکی ذخیره کنید. این کار باعث کاهش هزینه‌های پرینت و نگهداری سند‌های فیزیکی، افزایش دسترسی به اطلاعات و سهولت در مدیریت اطلاعات می‌شود. در نتیجه استفاده از فناوری OCR به عنوان یکی از روش‌های بایگانی اسناد و مستندات تصویری، بسیار موثر و کارآمد است.

502860