شـبـكــة عـمّـــار
إخبارية - ترفيهية
- تعليمية



جديد الصور
جديد الأخبار
جديد المقالات


جديد الصور

جديد البطاقات

جديد الصوتيات

المتواجدون الآن


تغذيات RSS

2012-08-08 06:10

شهدت التسعينيات أول تعامل مع الأنظمة المنطوقة بعد ما بات في وقت من الأوقات حلم مبرمجي الحاسوب الوصول إلى الطريقة التي تمكنهم من التحدث مع الحاسوب والتخاطب معه , هذه الطريقة التي أصبحت تستخدم لمساعدة من يواجهون صعوبة في استخدام لوحة المفاتيح أو الماوس ليتعاملوا مع الحاسوب , وهي مع ذلك وسيلة للرفاهية والراحة لدى الإنسان مما علمه الله لبني البشر ...

كان هذا العلم هو التعرف على الكلام الذي صار في بعض الدول المتقدمة وسيلة لإنجاز امتحانات الطلاب وحقق كثير من الأمن بعد ما استخدمته الجهات الأمنية .....

وأيضا التعرف على الكلام هو أحد الخصائص التي أتت بها ميكروسوفت أوفيس XP والتي جعلت من الممكن للمستخدمين إدخال النصوص وتنفيذ الأوامر والتحكم في النوافذ عن طريق التحدث في المايكروفون .....

و في هذه السلسلة من الدروس سنتحدث إنشاء الله عن هذا الفرع من علوم الحاسب الآلي ....



بداية حديثنا سيكون عن فروع علم الحاسب الآلي كالتالي:

1- علوم الحاسب الآلي (Computer Science CS)

2- نظم المعلومات (Information System IS)

وعلوم الحاسب الآلي(CS) بحد ذاتها يندرج تحتها عدة فروع نذكر منها :

معالجة الصور (Image Processing )

معالجة أو تشغيل الكلام (Speech Processing )

والذي نريد التوصل إليه أن (Speech Processing) معالجة الكلام هو أحد الأفرع الرئيسية لعلوم الحاسب الآلي

****والحاسب الآلي لكي يقوم بعملية معالجة الأصوات (الكلام بالأخص) يجب في البداية أن يقوم بالتعرف علي هذه الأصوات وهو ما يسمى ب(speech recognition) التعرف على الكلام وعليه سيكون محور حديثنا في هذه السلسلة


تلميح:

كلمة (Speech) :تعني الكلام

لكن (voice) : تعني الأصوات عموما ليس فقط الأصوات البشرية بل تتعدى ذلك إلى أصوات العصافير وأصوات الأجهزة وغير ذلك ..............

مثلا لدينا مصنع به العديد من الأجهزة فيهم جهاز جديد قمنا بتسجيل صوته عند أول تشغيل له وبذلك قد أخذنا بصمة له وهو جديد وبعد عمل هذا الجهاز 1000 ساعة مثلا عندها يحتاج الجهاز إلى صيانة نسجل صوته مرة أخرى ونأخذ بصمة أخرى له .............

..تبقى هذه البصمات الصوتية محفوظة لدينا .......

عندما يصادفنا جهاز في المصنع به عطل نأخذ منه بصمة صوتية (أي تسجيل صوتي لهذا الجهاز وهو يعمل) ونقارنها مع البصمات الصوتية المحفوظة لدينا مسبقا وعندها نقرر هل هذا الجهاز جديد أم أنه يحتاج إلى صيانة ........


ولذلك ما نعنيه في هذه السلسلة التعرف على الكلام (speech recognition) هو تعرف الحاسوب على صوت الإنسان...

نظام التعرف على الكلام(speech recognition system) :

هذا النظام ينجز 3 مهام أساسية منذ دخول الصوت إلى الحاسوب ومن ثم معالجته وحتى الاستفادة منه وهي :

1- Pre-processing

2- Recognition

3-Communication

وسنأخذ كل مرحلة بالتفصيل : أولا //ما يسمى ب Pre-processing :--

وهي العمليات التي تسبق المعالجة الأساسية للصوت وهي عبارة تحويل الصوت المدخل إلى الحاسوب إلى شكل يستطيع ال(Recognizer) التعامل معه

وال (Recognizer) متمثل في جزأين( s/w & h/w)

الs/w وهي البرامج التي تتعامل مع الإشارات الصوتية والخاصة بالتعرف على الصوتيات وال h/w هي الحاسوب نفسه

وبالتالي لكي يقوم الحاسوب بمعالجة الإشارات الصوتية والتعامل معها لا بد أن تتم عملية ال Pre-processing التي تتلخص في تحويل الإشارات الصوتية المدخلة إلى شكل ثنائي (0 & 1)

لنبدأ العملية من البداية س من الناس قام بتسجيل صوته عن طريق المايكروفون للحاسب, مجموعة الكلمات التي قام بتسجيلها هي عبارة سلسلة من الإشارات المتصلة والتي تعرف ب Analog signal وممكن تسميتها ب Continuous Signal

ومعنى أنها إشارات متصلة أي في كل لحظة زمنية توجد قيمة للصوت حتى لو توقف الشخص عن التحدث فإنه توجد إشارات بسيطة .

طيب تتحول هذه الإشارات المتصلة إلى إشارات منفصلة أو متقطعة والتي تعرف ب(discrete signal )

ولكي تتم عملية التحويل من discrete signal إلى 0&1 ( أوما يعرف ب digital signal أو binary form الشكل الثنائي ) حتى تكون في الصورة القابلة بأن يتعامل معها الحاسوب فإنه يتم عمل عملية تسمى ب Quantization :

وهي أخذ القيم المحصورة بين مستويين من الشكل السابق (2level)أو ما يسمى علميا ب(threshold) وتكون هذه القيم المحصورة قيما عشرية طبعا ويتم تحويلها إلى شكل ثنائي (0&1)

وبذلك تم تحويل الإشارات المتصلة (Analog Signal ) إلى الإشارات المتقطعة(Discrete Signal ) وبعدها عملية ال(Quantization) التي بدورها تنتج الصيغة الثنائية 0&1 وهي الصورة الوحيدة التي يستطيع الحاسوب التعامل معها وبالتالي تبدأ عملية المعالجة (Processing ) ..

وهذا هو دور كرت الصوت مبدئيا .....


ملاحظة :1- في الرسم البياني المصطلح Amplitude يعني قيمة الحرف عند لحظة زمنية معينة , حيث كل حرف لهamplitude مختلف عن الآخر ......أو هو مقدار الطاقة الموجودة في الموجة والتي تمثل بارتفاع الموجة .....ويتضح معنى ال amplitude

ومن الرسم أيضا يتضح أن المسافة بين قمتين هي طول الموجة....

2- أما بالنسبة للمصطلح threshold فهو علميا يشبه level في المعنى تقريبا ولكن بالتحديد هي مستوى محدد ومفروض لا يزيد ولا يقل عنه وال threshold ليست متساوية في جميع الإشارات بل الإشارات الصوتية لها threshold معينة و image لها threshold معينة وهكذا ....

أما مرحلة ال recognition و ال Communication فتابعوها في الدروس القادمة ......





تعليقات 0 | إهداء 0 | زيارات 704


خدمات المحتوى
  • مواقع النشر :
  • أضف محتوى في Digg
  • أضف محتوى في del.icio.us
  • أضف محتوى في StumbleUpon
  • أضف محتوى في Google


تقييم
1.00/10 (3 صوت)


Powered by Dimofinf cms Version 3.0.0
Copyright© Dimensions Of Information Inc.