به گزارش سایت خبری پرسون، ثبت و بایگانی اسناد و مستندات در سازمانهای بزرگ، کاری زمانبر و مهم محسوب میگردد. در همین راستا شرکتها و سازمانهای بزرگ از نرم افزار بایگانی اسناد یا همان مدیریت مستندات (DMS) استفاده مینمایند، تا قادر به دستهبندی بهتر اسناد و همچنین جستجو در بین آنها باشند.
اما هنوز مشکلات و کمبودهایی وجود دارد؛ زیرا برخی از اسناد و مدارک وارده به سامانههای آرشیو اسناد، به صورت عکس هستند و متن درون آنها قابل جستجو یا ویرایش نیست و افراد برای استفاده از متن آنها و یا جستجو در بین آنها، باید به صورت دستی، متن درون اسناد تصویری را تایپ کنند، که کاری بسیار زمانبر محسوب میگردد.
برخی از سامانههای آرشیو اسناد برای رفع این مشکل، از فناوری جدیدی به نام OCR استفاده میکنند؛ اما تکنولوژی OCR چیست؟ فناوری OCR چه کاربردی در نرم افزار بایگانی اسناد دارد؟ برای پاسخ به این سوالات، تا انتهای این مقاله از پرسون همراه ما باشید.
فناوری OCR چیست؟
OCR چیست؟ OCR مخفف عبارت Optical Character Recognition به معنای «تشخیص کاراکتر نوری» است و هدف آن، شناسایی کاراکترهای نوشتاری موجود در تصاویر و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانهها میباشد.
به بیان دیگر، به کمک فناوری OCR میتوان متن نامهها و اسنادی را که به صورت تصویری ثبت شدهاند، به فایلهای قابل ویرایش (مانند فایل Word) تبدیل نمود. شایان ذکر است که انواع مختلفی از فناوریهای OCR وجود دارند، که هر کدام از آنها به روش خاص خود، کاراکترهای نوشتاری درون تصاویر را شناسایی مینمایند و به فایلهای قابل ویرایش در کامپیوترها، تبدیل میکنند. انواع فناوریهای OCR عبارتاند از:
تشخیص هوشمند کلمه (Intelligent Word Recognition)
در این نوع از فناوری OCR، سیستم به جای شناسایی کاراکترهای تکی، کلمات را به صورت کامل شناسایی میکند؛ از این فناوری میتوان برای شناسایی و تبدیل متون دستنویس درون تصاویر استفاده کرد.
تشخیص کاراکتر هوشمند (Intelligent Character Recognition)
این فناوری نیز قابلیت شناسایی متون دستنویس و شکسته را دارد، اما بر خلاف مورد قبلی، در این نوع از OCR، به جای شناسایی کلمات به صورت کامل، حروف را به صورت تک تک شناسایی میکند و در نهایت با کنار هم قرار دادن آنها به ترتیب شناسایی، کلمات را تشخیص میدهد؛ شایان ذکر است که این فناوری به کمک قابلیت یادگیری ماشین (Machine Learning) تکامل و بهبود مییابد.
تشخیص نوری کلمه (Optical Word Recognition)
فناوری تشخیص نوری کلمه، برای شناسایی متون تایپ شده در تصاویر طراحی شد و توسعه پیدا کرد؛ این نوع از OCR متن تایپ شده را به صورت کلمههای مورد هدف قرار میدهد و آن را به متون قابل جستجو و ویرایش در کامپیوترها تبدیل میکند.
تشخیص کاراکتر نوری (Optical Character Recognition)
در این نوع از قابلیت OCR، همانند مورد قبلی متون تایپ شده در تصاویر شناسایی میشوند، با این تفاوت که در این فناوری، تک تک کاراکترها به صورت مجزا شناسایی میشوند و در نهایت در کنار یکدیگر قرار میگیرند.
تشخیص علامت نوری (Optical Mark Recognition)
قابلیت و فناوری تشخیص علامت نوری با هدف شناسایی علائم نوشته شده به دست انسان و تبدیل آنها به متون قابل ویرایش در کامپیوترها است؛ این متون ممکن است عددی و یا نوشتاری باشند.
مراحل کار نرم افزار OCR
همانطور که مطالعه کردیم، فناوری OCR دارای انواع مختلفی است که به کمک آنها میتوان هر نوع سند تصویری که دارای کاراکترها یا علائم نوشتاری است را به متونی قابل جستجو و ویرایش در کامپیوتر تبدیل نمود. حال این قابلیت و فناوری چه کاربردهایی در سامانهها و نرمافزارها دارد؟
تکنولوژی OCR چه کاربردهایی دارد؟
از فناوری OCR میتوان در سامانهها، نرمافزارها و ابزارهای مختلفی استفاده نمود؛ برخی از کاربردهای فناوری OCR عبارتاند از:
- تولید نرمافزارهای پلاکخوان
- تبدیل تصاویر اسناد به متن، مانند تبدیل کتابهای چاپی به نسخههای الکترونیکی قابل ویرایش.
- تبدیل انواع رسید مالی به اسناد قابل ویرایش
- تولید ابزار جستجوی متون در تصاویر
- تولید ابزار شناسایی و ترجمه متون درون تصاویر
- تبدیل فایلهای PDF به متن
- و...
کاربرد OCR در نرم افزار بایگانی اسناد چیست؟
با استفاده از فناوری OCR در نرم افزارهای بایگانی و آرشیو اسناد و مدیریت مستندات، فرآیند تبدیل تصویر (اسناد تصویری دارای متن) به متون قابل ویرایش و جستجو، در زمانی بسیار کم و با هزینهای بسیار پایین صورت میگیرد؛ به بیان دیگر، کاربران با استفاده از قابلیت OCR، بدون نیاز به تایپ و در کمترین زمان ممکن، قادر به تبدیل اسناد تصویری خود، به اسناد متنی قابل ویرایش و جستجو میباشند
انواع مختلفی از نرم افزارهای مدیریت مستندات و آرشیو اسناد وجود دارند، اما تنها برخی از آنها دارای فناوری OCR هستند و یکی از بهترین نرم افزارهای آرشیو و بایگانی که دارای قابلیت OCR هم است، نرم افزار بایگانی اسناد فراگستر میباشد.
این نرمافزار یکی از زیرسیستمهای اتوماسیون اداری فراگستر است. نرم افزار بایگانی اسناد فراگستر با استفاده از فناوری OCR، قادر به شناسایی متون فارسی در انواع تصاویر اسکن شده، تصاویر دریافتی از درگاههای مختلف (مانند درگاههای فکس، ایمیل، ECE) و سامانههای مختلف (مانند پیشخوان خدمت) میباشد.
قابلیت OCR فارسی فراگستر، کاربردها و مزایای گوناگونی در نرم افزار مدیریت مستندات دارد، که برخی از آنها عبارتاند از:
- افزایش دقت بازشناسی اسناد
- استخراج متن از انواع فرمت تصاویر (مانند BMP، JPG، PDF، PNG و TIFF)
- پشتیبانی کامل از زبانهای فارسی و انگلیسی
- تشخیص خودکار متن، گرافیک، جدول و اعداد در تصاویر
- پشتیبانی از انواع فونتهای مرسوم و پرکاربرد در سازمانها (مانند نازنین، میترا، زر، لوتوس، یاقوت، هما، تیتر، ترافیک، تایمز و تاهما)
- انجام فرآیند موازی OCR جهت کاهش زمان اجرای فرآیند شناسایی متون
- و...
با استفاده از فناوری OCR در نرم افزار بایگانی اسناد فراگستر، در کمترین زمان و با بالاترین دقت، قادر به تبدیل تصاویر حاوی نوشته، به فایلهای متنی قابل ویرایش و جستجو میباشید.
یکی از مهمترین ویژگیهای OCR فراگستر، پشتیبانی آن از زبان فارسی است؛ زیرا متون فارسی به دلیل رسمالخط این زبان، به راحتی قابل تشخیص نیستند و از طرفی متون فارسی تایپ شده هم دارای فونتهای گوناگونی میباشند که در فرآیند تشخیص آنها توسط OCR، اختلال ایجاد میکند. مراحل کار قابلیت OCR در نرم افزار بایگانی فراگستر، مطابق تصویر زیر میباشد:
لازم به ذکر است که نرم افزار مدیریت و بایگانی مستندات فراگستر، علاوه بر قابلیت OCR فارسی، دارای ویژگیها و کاربردهای دیگری هم هست، که برخی از آنها عبارتاند از:
- قابلیت تعریف، ثبت و گردش انواع اسناد (مانند اسناد ایزو، اداری-ستادی، مهندسی، مالی، منابع انسانی، فنی و پروژهها و...)
- قابلیت یکپارچگی با نرمافزارهای خانواده Office
- قابلیت ایجاد ارتباط یک نامه به یک سند از کارتابل اتوماسیون اداری
- امکان تعریف و گردش فرمهای اطلاعاتی (Enterprise Form Generator)
- پشتیبانی کامل از قابلیت OCR فارسی (فراهم کردن امکان جستجو و بازیابی اسناد)
- قابلیت کاهش نویز تصاویر اسکن شده (کاهش حجم ترافیک شبکه و افزایش سرعت دسترسپذیری اسناد)
- قابلیت کتابخانه اسناد (امکان تعریف دستهبندیهای درختوارهای، امکان تعریف سطوح دسترسی و...)
- قابلیت جستجوی پیشرفته (جستجو داخل متن مستندات و فایلهای Word، PDF و Excel)
همانطور که در این مقاله آشنا شدید، با فناوری OCR در داخل نرم افزار مدیریت مستندات فراگستر میتوانید مستندات تصویری مانند فاکتورها، قراردادها، سندهای بانکی و ... را به راحتی و با سرعت بالا تشخیص داده و به صورت الکترونیکی ذخیره کنید. این کار باعث کاهش هزینههای پرینت و نگهداری سندهای فیزیکی، افزایش دسترسی به اطلاعات و سهولت در مدیریت اطلاعات میشود. در نتیجه استفاده از فناوری OCR به عنوان یکی از روشهای بایگانی اسناد و مستندات تصویری، بسیار موثر و کارآمد است.