التعرف على الأصوات 2

شـبـكــة عـمّـــار
إخبارية - ترفيهية - تعليمية

السبت 20 أبريل 2024

جديد الصور	Desktop 1953 Desktop 1951 Desktop 1957 Desktop 1956 Desktop 1952 Desktop 1959 Desktop 1955 Desktop 1954 Desktop 1960 Desktop 1971
جديد الأخبار	مسح عنق الرحم بداية من سن 21 عامًا يكشف مرض السرطان مبكرًا منطقة اليورو تعود إلى انكماش الأسعار فى فبراير ممارسة الرياضة تساعد الطفل على التعلم بشكل أفضل أبل تطرح هاتف iphone 5se بسعر أرخص من iphone 6 رئيس "CIA" السابق: حدود الشرق الأوسط مهددة بالانهيار "بلحاج" يعود بقوة للمشهد السياسي في ليبيا سيناريوهات خلافة عباس على رأس السلطة الفلسطينية الذهب العالمى يرتفع 1% ويتجه لتسجيل أفضل شهر فى 4 أعوام فرنسا تدعو لاجتماع فوري لبحث انتهاك الهدنة في سوريا "النواب" المصري يمنع "عكاشة" من الحضور 10 جلسات
جديد المقالات	كيف الحصول عليه؟ إعدام التربية الدينية ! اقرأ لطفلك.. يصبح قارئاً وصايا لتربية الأبناء ألا من كلاب لأطفالنا !! من ثمرات معلم أقصُّ عليكم.. نبأ ابنتي الفطام الثاني واليوم الأول من الدراسة موجة دش هروب الفتيات... خطأ مشترك !!

جديد الصور

جديد البطاقات

جديد الصوتيات

002 - البقرة . Al-Baqarah

003 - آل عمران . Al-Imran

المتواجدون الآن

تغذيات RSS

دروس في الذكاء الاصطناعي

التعرف على الأصوات وتمييز الأنماط ومعالجة الصور

2012-08-08 06:07

استكمالا للدرس السابق والذي تحدثنا فيه عن علم التعرف على الأصوات وذكرنا المهام الثلاثة الرئيسة التي ينجزها نظام التعرف على الكلام (Speech Recognition System ) وهي : pre-processing - recognition - communication

بعد مرحلة ال pre-processing التي تم فيها تحويل الإشارات المتصلة (analog signal)إلى عدد من ال0&1 (digital signal)لكي تصبح جاهزة للتخاطب مع الحاسوب تأتي مرحلة ...............

2-recognition: هي مرحلة التعرف على الصوت المدخل وتنقسم هذه المرحلة إلى قسمين (identification --&-- verification)

وفي كل من هذين القسمين يجب فيها إجراء نوع من الاختبار وأوضح أنه يجب في البداية عمل الidentification ثم ال verification

لنبدأ بإيضاح معنى ال identification بالمثال التالي :

نفرض أنه يوجد لدينا مجموعة من الطلبة موجودين بمكان واحد وكانت الطالبة x أحد الموجودين , ولدينا بصمة لصوت الطالبة x (طبعا متمثلة بالثنائي 1&0) ونحن نريد معرفة هل الطالبة x هي ضمن هذه المجموعة أم لا ؟؟ماذا سنفعل ؟؟

سنقوم في البداية بأخذ بصمة صوتية(البصمة الصوتية هي تسجيل صوتي دقيق للشخص ) لكل شخص من الموجودين ونقارنها وحدا واحدا مع بصمة الطالبة x ولكن طريقة المقارنة ستتم بطريقة خاصة تسمى بDistance measurement وهي أنني أقوم بعمل مقارنة بين بصمة الطالبة x وبين كل بصمة داخل المجموعة فإذا وجدت بصمة في هذه المجموعة أقرب ما يكون إلى بصمة الطالبة x عندها نستطيع القول أن الطالبة x موجودة ضمن هذه المجموعة ..

إذن هذه المرحلة identification توضح لي بطريقة القياس الخاصة Distance measurement هل الشخص موجود أم لا ضمن كثافة معينة ولكن نحن في هذه الحالة لسنا متأكدين هل البصمة التي ظهرت نتيجة الاختبار السابق هي x فعلا أم لا ..إذن لكي أتأكد من أنها هي الطالبة x بعينها نقوم بعملية ال verification وهي مرحلة التحقق كيف ؟؟

verification: -- في هذه المرحلة نقوم بأخذ العنصر (الذي نتج لدينا من الاختبار السابق أنه أقرب ما يكون لبصمة صوت الطالبة x ) منفردا وعندها نتحقق ونتأكد هل هو فعلا x أم لا

وبذلك تنتهي مرحلة ال recognition ولكن بعد كل عمليات التعرف هذه لابد تطبيقات تستفيد من هذه الصوتيات المدخلة للحاسوب إذن تأتي مرحلة ال Communication

3-Communication: هي الاتصال أو إرسال المُدخل بعد أنّ تم التعرف عليه إلى أنظمة ال S/W أو H/W التي تحتاجه وأمثلة على ذلك::

**Security: -- وكما يتضح من الاسم أننا ممكن نستخدم الصوت في تحقيق الأمن ,مثلا نفرض أننا قمنا بعمل نظام صوتي للدخول لإحدى القاعات وقمنا بأخذ بصمة صوتية لشخص معين ووضعناه في الحاسوب الموضوع عليه النظام بحيث لو قال "سبحان الله" مثلا يتم فتح باب القاعة

لو أتى الشخص وأدخل الجملة "سبحان الله " إلى النظام بواسطة ميكروفون أو غيره سيقوم كرت الصوت مبدئيا كما قلنا بتحويل الإشارات المتصلة إلى إشارات رقمية 1&0 وبعدها تتم عملية التعرف بمقارنة البصمة المسجلة في النظام مع البصمة الجديدة المدخلة حاليا فإذا تطابقت البصمتين أو مع وجود نسبة خطأ بسيطة جدا مسموح بها فإنه سيتم فتح باب القاعة ....

طبعا الsecurity ممكن يتم عمله بعده تقنيات منها بصمة العين والشفاه!! وغيرها ولكن الصوت من الأشياء الصعب وجود شبيه لها حتى لو أتى نفس الشخص المدخل صوته في النظام وسجل صوته في كاسيت وعند دخوله للقاعة أدخل الصوت للنظام بواسطة هذا الكاسيت فإنه لن يتم فتح الباب بسبب عدم تطابق البصمتين لماذا؟؟ لأنه نتج من تسجيل الصوت ما يسمى ب white noise وهي الضوضاء الناتجة عن عملية التسجيل حيث شريط الكاسيت عبارة عن مكونات إلكترونية فعندما أقوم بتسجيل الصوت تضاف فوق الإشارات الصوتية إشارات أخرى تسبب الnoise وبالتالي تتسبب في الاختلاف عن الصوت الأصلي ...

تلميح::عندما نلاحظ الإشارات الصوتية لشخص يتحدث نلاحظ فترات السكوت تمثل أيضا بواسطة موجات لكنها بسيطة جدا تسمى noise

**education:-ممكن نستخدم ال speech في التعليم أيضا ..

**control: ممكن التحكم في الأجهزة الكهربائية بواسطة الصوت أيضا ..

** Diagnosis:- و معناها تشخيص الأمراض أعني أنه يمكن بواسطة ميكانيزم معين عندما ينطق الشخص عدة كلمات يتم تشخيص حالته .....

وبالمناسبة تشخيص الأمراض في علوم الحاسب يشكل فرع هام جدا نسميه ب(Bio informatics) المعلوماتية العضوية وهي الخاصة بأعضاء الإنسان والتي يتم فيها تشخيص الأمراض بواسطة طريقتين ,,,الأولى وهو ما عرفناه (speech processing)

أما الثانية فهي (image processing) والتي تعتمد على الأشعة وغيرها .....وهي خارج موضوعنا ...........

****وأخيرا هذه المراحل الثلاثة (pre-processing , recognition , communication) هي غير مرئية للمستخدم لكن كل ما يراه المستخدم من عملية التعرف التي تنجز له بواسطة برنامج أو غيره هي : دقة تعرف هذا البرنامج على الكلام و سرعة التعرف أي سرعة تنفيذ البرنامج ........... ومن هذه النقطتين يستطيع المستخدم من عمل تقدير للبرنامج.....

ننتقل الآن للتقسيمة الرئيسية لمعالجة الكلام .......

0 |

0 |

697

خدمات المحتوى

أدوات :
[إرسال لصديق]
[طباعة]
[حفظ بإسم]
[حفظ PDF]

مواقع النشر :

تقييم

1.00/10 (3 صوت)