mardi 22 mai 2012

التعرف الضوئي على الحروف



نتيجة للتطورات التقنية و التكنولوجية التي يعرفها عصرنا الحالي والذي أصبح يسمى بالعصرالرقمي نتاجا للاستخدام المكثف للتكنولوجيات الرقمية في جميع مجالات الحياة و المعرفة ولعل من أبرز هذه التقنيات أو التحولات ما يعرف اليوم بالرقمنة التي تعني تحويل المواد المعلوماتية سواء كانت نصية فقط أوتحتوي على إيضاحات ورسوم عن طريق الماسحات الضوئية  الى صورة  مفهومة من طرف   الحاسوب لا يمكن التعامل معها .
هذا مادعى إلى التفكير في إيجاد تقنية تساعد في التعرف وقراءة نص معين أثناء إجراء عملية المسح الضوئي وتحويله إلى أرقام و رموز من خلال إمكانية التنقيح الكامل وهذا ما يعرف بتقنيات التعرف الضوئي على الحروف
تعريف التعرف الضوئي على الحروف:
         تمكن تقنية التعرف الضوئي للحروف الحاسوب من قراءة النص الناتج عن تحويل الصورة التي تحتوي على نص الملف أو الوثيقة المرقمنة  إلى ملف نصي وفق معايير   الاسكي  بحيث يصبح بالإمكان تكشيفه ،إعادة معالجته واستعماله.
         تتم عملية التعرف على الرموز المشكلة لنص الوثيقة المرقمنة من خلال مقارنتها مع قاموس مدمج في برنامج التعرف الضوئي كما يتطلب الأمر في كثير من الحالات القيام بتصحيح الرموز التي لم يتمكن النظام من التعرف عليها،او التي تعرف عليها بشكل خاطئ
تاريخ ظهور التعرف الضوئي على الحروف
- عام 1950 طلب Frank Rowlett من David Sheppard أن يعمل مع Louis Tortilla كي يتم تحويل الرسائل المطبوعة إلي لغة الآلة كي يتم التعامل معها كنصوص Text ....وبدأ David Sheppard وعمل آلة سماها Gismo ولكن مشكلتها إن الكتابة يجب أن تكون عرضية و مضبوطة لكي تستطيع الآلة أن تقرأها.
2-عام 1953 جاء Sheppard بالتطوير الجديد وهو تأسيس مؤسسة اسمها Intelligent Machines Research Corporation والتي قدمت نظم     OCR لتستخدم للأغراض التجارية ...وقد تميز نظام  IMR بأنه يستطيع التعرف علي الحروف في أي مكان من الصورة .
3- عام 1955 تم استخدام ال OCR في غرض تجاري في مجلة ال Readers Digest لأول مرة ... وتم بيع النظام الثاني ل Standard Oil Company في كاليفورنيا وكذلك العديد من شركات البترول بعدها.
4- في أواخر الخمسينيات تم استخدام النظام من قبل إحدى شركات خدمات التليفون والبريد وهى شركة Ohio Bell Telephone Company وكذلك تم بيعها للقوات الجوية الأمريكية التي استخدمتها في الاتصالات
5- في عام 1965 استخدمت شركة الولايات المتحدة لخدمات البريد United States Postal Service تقنية ال OCR لتفرز رسائل البريد الواردة وذلك باستخدام أحد الابتكارات لشخص اسمه Jacob Rabinow
6- عام 1971 بدأ البريد الكندي Canada Post في استخدام ال OCR . حيث كان استخدامه في البريد يعتمد علي mechanism محدد وهي قراءة الاسم والعنوان ثم طباعة Bar Code مناسب علي المظروف .. هذا ال Bar Code يحتوي علي ال Postal Code الخاص بالعنوان المقصود وبهذا يتم توجيه الرسالة إلي العنوان بناءا علي هذا ال Bar Code لكنهم وجدوا أن هذه التقنية مكلفة نوعا ما لأنها تعتمد إلا علي ال Bar Code.
معايير إختيار برمجيات   OCR :
تعتمد المكتبات ومؤسسات المعلومات في اختيارها لبرمجيات التعرف الضوئي على الحروف على مدى صلاحيتها للاستخدام والتطبيق، واشتمالها على قواميس متخصصة غنية وثرية بمفردات المحتوى الموضوعي لنصوص مصادر المعلومات التي يمكن معالجتها بواسطة مثل هذه البرمجيات.ومن اهم هذه المعاييرمايلي:
     1.الدقة: ويمكن تقدير معدل الدقة من خلال التعرف على نسبة الأخطاء الناجمة عن إجراء القراءة الضوئية للنصوص، ويمكن قياس معدل دقة البرنامج عبر النسبة المئوية للكلمات
2. التطابق والتوافق مع أجهزة المسح الضوئي المتنوعة: من المهم التحقق من نوع أجهزة الماسحات الضوئية التي يمكن أن تتعامل معها برمجيات "
OCR"، أي ضرورة التوافق بين جهاز الماسح الضوئي المستخدم من ناحية وبرنامج التعرف الضوئي على الحروف من ناحية أخرى، وفي هذه الحالة من الضروري تطابق وتوافق البرنامج مع معيار "TWAIN" المستخدم من جانب غالبية الماسحات الضوئية.
.3. واجهة المستفيد: يمكن أن يخلق التصميم الشكلي الجذاب نوع من التحاور والتفاعل بين المستخدم من ناحية وبين البرنامج من ناحية أخرى، ومن بين الآليات التي تحتويها تلك البرمجيات بعض الأزرار التي تسمح عند الضغط عليها بواسطة "الفارة" القيام بالعديد من المهام، وذلك في أثناء عملية التعرف الضوئي للحروف في نص معين.
 4.القدرة على التعرف على الجداول: تعتبر إمكانية التعرف الشكلي والهيكلي للجداول خاصية مميزة لبعض فئات برمجيات "OCR"، ولهذا السبب من المفيد أن يكون البرنامج قادراً على اكتشاف وجود جداول في النص ومن ثم إعادة صياغتها في إحدى برمجيات معالجة النصوص.
5. أشكال الحفظ والتخزين: من المعروف أن تسجيل البيانات والمعلومات المرقمنة في ملف يجب أن يكون وفقاً لشكل أو قالب أو امتداد معين وذلك بهدف إمكانية القراءة والإطلاع عليه في وقت لاحق، ولذلك فإن برمجيات OCRتتضمن أشكالاً مخصصة لتسجيل ومن ثم حفظ واسترجاع المعلومات في الملفات، ومن أهم هذه الأشكال: doc,pdf,excel
6. الالتزام بشكل النص الأصلي: يحقق الالتزام بشكل النص الأصلي إمكانية الحصول في صورة الكترونية على نفس التكوين الهيكلي والتنظيمي للصفحة الأصلية التي يتم رقمنتها ، إلي جانب استنساخ نفس الخصائص النصية من نوع الحرف وحجمه وشكله، وجسم النص، والأسلوب.
7. اللغات: كلما زادت وتعددت اللغات التي يمكن التعرف عليها كلما كانت برمجيات OCR أكثر قدرة على التعرف على النصوص المكتوبة بتلك اللغات المتنوعة.
مزايا التعرف الضوئي على الحروف
1- إمكانية معالجة محتوى الملف او الوثيقة المرقمنة باستعمال برنامج معالجة النصوص(نسخ/لصق...)او باستعمال أي برنامج تطبيقات مكتبية أخر.بالاضافة إلى إمكانية إدماج عناصر الوثيقة في تطبيقات مثل قواعد المعلومات.
2-إمكانية تكشيف نص الملف أو الوثيقة المرقمنة بطريقة آلية.
3-يعتبر ألOCR شكل من أشكال  التكثيف ،بحيث يؤدي إلى تقليص حجم الملف أو الوثيقة المرقمنة.
4-تحسين نوعية و سرعة طباعة و تصفح الملف او الوثيقة المرقمنة على شاشة الحاسوب.


في الأخير يمكن القول أن تقنية التعرف الضوئي على الحروف تنبع أهميتها من خلال توفيره وقت وجهد و تكلفة عملية إدخال عدد كبير من النصوص و إنشاء ملف نصي يمكن من خلاله البحث في النص الكامل و التعديل فيه إلا أن عملية التعرف الضوئي تتوقف على عدة عوامل منها الوضوح ودقة الصورة المطبوعة وغناها بالجداول والرسوم .
في الأخير يمكن القول أن تقنية التعرف الضوئي على الحروف تنبع أهميتها من خلال توفيره وقت وجهد و تكلفة عملية إدخال عدد كبير من النصوص و إنشاء ملف نصي يمكن من خلاله البحث في النص الكامل و التعديل فيه إلا أن عملية التعرف الضوئي تتوقف على عدة عوامل منها الوضوح ودقة الصورة المطبوعة وغناها بالجداول والرسوم .

3 commentaires: