شـبـكــة عـمّـــار
إخبارية - ترفيهية
- تعليمية



جديد الصور
جديد الأخبار
جديد المقالات


جديد الصور

جديد البطاقات

جديد الصوتيات

المتواجدون الآن


تغذيات RSS

2012-08-08 06:04

**يمكننا تصنيف التعرف على الكلام كالتالي:--

**(isolated word recognition (I W R : ويستخدم للتعرف على كلمات منفصلة ومعزولة عن بعضها وهو أسهل أنواع التعرف وذلك لأننا لا نواجه مشكلة ال co-articulation وهي التقاء الحرف في نهاية الكلمة الأولى مع الحرف في بداية الكلمة الثانية مما يسبب صعوبة في التعرف..

**(connected word recognition (C W R:-يستخدم للتعرف على مجموعة من الكلمات بفواصل وذلك بوضع Stops بين الكلمات وهو يشبه النوع السابق لكنه أصعب في التعرف ..

**(continuous speech recognition (C S R: وهي للتعرف على الكلام المتواصل وإلى الآن مازال به العديد من المشاكل وهذا الصنف يحتاج إلى الكثير من التدريب وهو من أصعب الأنواع في التعرف ..

** (Speech understanding(S U :- وهي عمليات فهم الكلام بواسطة مترجمات خاصة وممكن تحويله إلى نصوص بعد التعرف عليه ..

** ( speaker identification ,speaker verification (S I, S V : والتي تحدثنا عنها بالدرس الأول ...

** ( word spotting (w S:-ويستخدم للتنقيب عن كلمات معينة أو ما يسمى بالـ(key word ) في موضوع معين ...


وبما أننا في هذه السلسلة نتحدث عن علم التعرف على الكلام فإننا سنتطرق إلى عدة جوانب خاصة بكيفية إنتاج الكلام وأعضاء النطق في الإنسان وبعض المعلومات الخاصة بهذا المجال ...................

***في عمليات التعرف على الكلام من المهم أن نركز على كيفية إنتاج الكلام , وعملية إنتاج الكلام تبدأ بالتفكير في الرسالة التي يريد الشخص النطق بها وهذه الرسالة ستتحول بعد ذلك إلى إشارات عصبية (neural signal) , التي تصبح غالبا إشارات كهربية تحرك أعضاء النطق,و بعد أن تتحرك أعضاء النطق سوف تنفذ سلسلة متتابعة من الإشارات (gestures)التي ينتج في نهايتها الـ Waveform الذي يحتوي على معلومات الرسالة الأصلية وعندها تُسمع الرسالة للطرف الآخر ..أي سوف تُنتج الكلمة أو المنطوق(utterance).....


*** الـ Waveform /هي عبارة عن شكل من أشكال الموجات وإحدى الطرق التي نستطيع تمثيل الكلام (speech)بواسطتها..,وكل الموجات الصوتية التي رسمناها في الدروس السابقة كانت Waveform ...وهي أسهل الموجات .....



***وإحداثيات الـWaveform السيني هو الوقت(time) , والصادي يمثل الطاقة للحرف(Energy) أو الـ(Amplitude)....

**وهناك أنواع أخرى للموجات نستطيع بواسطتها تمثيل الكلام ومنها ما يسمى بـــ(spectrum ) الذي تكون إحداثياته كالتالي: السيني يمثل الترددات (frequencies) والصادي يمثل الـ (Amplitude).......,وهي أسهل في عملية المعالجة processing



** أما ال Spectrogram فإننا نستطيع تمثيل الكلام بها وهي ذات 3 أبعاد : الوقت (time), التردد(frequency ), والـ(amplitude) ولكنها صعبة في التعامل مع الwave ومعالجتها ..


***عندما أريد أن أنطق أي كلمة (utterance) في البداية سيتم التنفس من الرئتين ثم يخرج الهواء إلى الحنجرة والذي يسبب عند مروره بها اهتزاز الحبال الصوتية (vocal folds or vocal cords)ويستمر في مسيره حتى يصل إلى القناة الصوتية (vocal tract) ومنه إلى التجويف الفمي (oral cavity) وممكن في بعض الحروف(مثل م-ن ) يضطر الهواء للمرور بالتجويف الأنفي (nasal cavity) وبعدها تخرج الكلمة وتصبح مسموعة وتتحول إلى الـwave form عندها سنطلق عليها مسمى (Acoustic) ....

إذن نطلق على الكلمة مصطلح (acoustic)عندما تخرج من الفم وتتحول إلى Waveform و تصبح مسموعة .....

***والعملية العكسية هي الأذن التي تستقبل هذا الكلام, حيث تدخل الإشارة إلى طبلة الأذن وتبدأ المطرقة تضرب وتصل الرسالة إلى الشخص الآخر ويسمع الكلمة ...

**الجهاز الصوتي أو جهاز النطق (vocal apparatus): يتمثل في 3 أعضاء رئيسية هي الحلق (Throat), الفم (mouth), الأنف(nose).....

الحلق (throat) يحتوي على الحبال الصوتية (vocal cords)التي تهتز لتنتج لنا الأصوات .

** نقاط النطق تتمثل في : الأسنان (teeth), اللسان(Tongue) , اللهاة (velum),الجزء العظمي خلف الأسنان العليا(alveolar), الحنك الأعلى(Hard palate : roof of the mouth ) أو ما يعرف ب سقف الفم ,و الشفاه (lips).....


أود أن أوضح الآن عدة مفاهيم تختص بالموجات الصوتية.....................

*** عندنا في الموجات ما يكون كالشكل التالي حيث الموجات متساوية جدا وهذا ما نسميه بـ(periodic) وهذه الموجات مستحيل أن تعبر عن الموجات الصوتية حيث أن الموجات الصوتية المسموعة (voiced) موجات غير متساوية ....





***ولذلك فإن موجات الصوت المسموعة (voiced) نمثلها بما يسمى بـ(quasi periodic) أو (like periodic),وهي تعني أنها أنها ليست دورة متساوية مثل الشكل السابق , وذلك بسبب أن موجات الكلام مستحيل أن تتساوى ويتخللها فترات من ال (noise) وشكلها تقريبا كالتالي :--


المهم أن تكون الموجات غير متساوية

**وهناك مسمى للموجات وهو ما نمثل به الـ (noise) وهي random وذلك بسبب عشوائيتها انظر الشكل :---



.وهي التي تمثل فترات بين الكلام مثل التنفس


تعليقات 0 | إهداء 0 | زيارات 684


خدمات المحتوى
  • مواقع النشر :
  • أضف محتوى في Digg
  • أضف محتوى في del.icio.us
  • أضف محتوى في StumbleUpon
  • أضف محتوى في Google


تقييم
1.00/10 (3 صوت)


Powered by Dimofinf cms Version 3.0.0
Copyright© Dimensions Of Information Inc.