شـبـكــة عـمّـــار
إخبارية - ترفيهية
- تعليمية



جديد الصور
جديد الأخبار
جديد المقالات


جديد الصور

جديد البطاقات

جديد الصوتيات

المتواجدون الآن


تغذيات RSS

2012-08-08 06:07

استكمالا للدرس السابق والذي تحدثنا فيه عن علم التعرف على الأصوات وذكرنا المهام الثلاثة الرئيسة التي ينجزها نظام التعرف على الكلام (Speech Recognition System ) وهي : pre-processing - recognition - communication

بعد مرحلة ال pre-processing التي تم فيها تحويل الإشارات المتصلة (analog signal)إلى عدد من ال0&1 (digital signal)لكي تصبح جاهزة للتخاطب مع الحاسوب تأتي مرحلة ...............

2-recognition: هي مرحلة التعرف على الصوت المدخل وتنقسم هذه المرحلة إلى قسمين (identification --&-- verification)

وفي كل من هذين القسمين يجب فيها إجراء نوع من الاختبار وأوضح أنه يجب في البداية عمل الidentification ثم ال verification

لنبدأ بإيضاح معنى ال identification بالمثال التالي :

نفرض أنه يوجد لدينا مجموعة من الطلبة موجودين بمكان واحد وكانت الطالبة x أحد الموجودين , ولدينا بصمة لصوت الطالبة x (طبعا متمثلة بالثنائي 1&0) ونحن نريد معرفة هل الطالبة x هي ضمن هذه المجموعة أم لا ؟؟ماذا سنفعل ؟؟

سنقوم في البداية بأخذ بصمة صوتية(البصمة الصوتية هي تسجيل صوتي دقيق للشخص ) لكل شخص من الموجودين ونقارنها وحدا واحدا مع بصمة الطالبة x ولكن طريقة المقارنة ستتم بطريقة خاصة تسمى بDistance measurement وهي أنني أقوم بعمل مقارنة بين بصمة الطالبة x وبين كل بصمة داخل المجموعة فإذا وجدت بصمة في هذه المجموعة أقرب ما يكون إلى بصمة الطالبة x عندها نستطيع القول أن الطالبة x موجودة ضمن هذه المجموعة ..

إذن هذه المرحلة identification توضح لي بطريقة القياس الخاصة Distance measurement هل الشخص موجود أم لا ضمن كثافة معينة ولكن نحن في هذه الحالة لسنا متأكدين هل البصمة التي ظهرت نتيجة الاختبار السابق هي x فعلا أم لا ..إذن لكي أتأكد من أنها هي الطالبة x بعينها نقوم بعملية ال verification وهي مرحلة التحقق كيف ؟؟

verification: -- في هذه المرحلة نقوم بأخذ العنصر (الذي نتج لدينا من الاختبار السابق أنه أقرب ما يكون لبصمة صوت الطالبة x ) منفردا وعندها نتحقق ونتأكد هل هو فعلا x أم لا

وبذلك تنتهي مرحلة ال recognition ولكن بعد كل عمليات التعرف هذه لابد تطبيقات تستفيد من هذه الصوتيات المدخلة للحاسوب إذن تأتي مرحلة ال Communication

3-Communication: هي الاتصال أو إرسال المُدخل بعد أنّ تم التعرف عليه إلى أنظمة ال S/W أو H/W التي تحتاجه وأمثلة على ذلك::

**Security: -- وكما يتضح من الاسم أننا ممكن نستخدم الصوت في تحقيق الأمن ,مثلا نفرض أننا قمنا بعمل نظام صوتي للدخول لإحدى القاعات وقمنا بأخذ بصمة صوتية لشخص معين ووضعناه في الحاسوب الموضوع عليه النظام بحيث لو قال "سبحان الله" مثلا يتم فتح باب القاعة

لو أتى الشخص وأدخل الجملة "سبحان الله " إلى النظام بواسطة ميكروفون أو غيره سيقوم كرت الصوت مبدئيا كما قلنا بتحويل الإشارات المتصلة إلى إشارات رقمية 1&0 وبعدها تتم عملية التعرف بمقارنة البصمة المسجلة في النظام مع البصمة الجديدة المدخلة حاليا فإذا تطابقت البصمتين أو مع وجود نسبة خطأ بسيطة جدا مسموح بها فإنه سيتم فتح باب القاعة ....

طبعا الsecurity ممكن يتم عمله بعده تقنيات منها بصمة العين والشفاه!! وغيرها ولكن الصوت من الأشياء الصعب وجود شبيه لها حتى لو أتى نفس الشخص المدخل صوته في النظام وسجل صوته في كاسيت وعند دخوله للقاعة أدخل الصوت للنظام بواسطة هذا الكاسيت فإنه لن يتم فتح الباب بسبب عدم تطابق البصمتين لماذا؟؟ لأنه نتج من تسجيل الصوت ما يسمى ب white noise وهي الضوضاء الناتجة عن عملية التسجيل حيث شريط الكاسيت عبارة عن مكونات إلكترونية فعندما أقوم بتسجيل الصوت تضاف فوق الإشارات الصوتية إشارات أخرى تسبب الnoise وبالتالي تتسبب في الاختلاف عن الصوت الأصلي ...

تلميح::عندما نلاحظ الإشارات الصوتية لشخص يتحدث نلاحظ فترات السكوت تمثل أيضا بواسطة موجات لكنها بسيطة جدا تسمى noise


**education:-ممكن نستخدم ال speech في التعليم أيضا ..

**control: ممكن التحكم في الأجهزة الكهربائية بواسطة الصوت أيضا ..

** Diagnosis:- و معناها تشخيص الأمراض أعني أنه يمكن بواسطة ميكانيزم معين عندما ينطق الشخص عدة كلمات يتم تشخيص حالته .....

وبالمناسبة تشخيص الأمراض في علوم الحاسب يشكل فرع هام جدا نسميه ب(Bio informatics) المعلوماتية العضوية وهي الخاصة بأعضاء الإنسان والتي يتم فيها تشخيص الأمراض بواسطة طريقتين ,,,الأولى وهو ما عرفناه (speech processing)

أما الثانية فهي (image processing) والتي تعتمد على الأشعة وغيرها .....وهي خارج موضوعنا ...........

****وأخيرا هذه المراحل الثلاثة (pre-processing , recognition , communication) هي غير مرئية للمستخدم لكن كل ما يراه المستخدم من عملية التعرف التي تنجز له بواسطة برنامج أو غيره هي : دقة تعرف هذا البرنامج على الكلام و سرعة التعرف أي سرعة تنفيذ البرنامج ........... ومن هذه النقطتين يستطيع المستخدم من عمل تقدير للبرنامج.....


ننتقل الآن للتقسيمة الرئيسية لمعالجة الكلام .......





تعليقات 0 | إهداء 0 | زيارات 697


خدمات المحتوى
  • مواقع النشر :
  • أضف محتوى في Digg
  • أضف محتوى في del.icio.us
  • أضف محتوى في StumbleUpon
  • أضف محتوى في Google


تقييم
1.00/10 (3 صوت)


Powered by Dimofinf cms Version 3.0.0
Copyright© Dimensions Of Information Inc.