generator
Glottal
pulse
model G(z)
Random
noise
generator
Gain for noise source
Gain for voice source
Vocal-tract
model H(z)
Radiation
model R(z)
Voiced/
unvoiced
switch
Speech
Plips(n)=s(n)
uglottis(n)
شکل۱-۲- مدل زمان گسسته عمومی برای تولید سیگنال گفتار
پایان نامه - مقاله - پروژه
را تغذیه کند. تابع تبدیل  نیز به شکل زیر مدل می شود.

 

  (۱-۱)

که  بیانگر ترم گین سراسری است و  مکان قطب موهومی برای مدل  لوله است. همانطور که ذکر شد، حروف صدادار شامل یک گرفتگی کوچک در حفره صوتی می باشد در حالیکه حروف بی صدا از یک گرفتگی قابل ملاحظه در حفره صوتی ایجاد می شود. لذا از لحاظ دامنه کوچکتر از حروف صدادار است و ماهیت نویزی دارد. برخی از تفاوت های حروف بی صدا و صدادار در شکل های (۱-۳) و (۱-۴) دیده می شود. حالت پریودیک حروف صدادار در شکل (۱-۴) به وضوح دیده می شود. برای مطالعه فرکانس های موجود در گفتار از تبدیل فوریه استفاده می شود. در شکل (۱-۵) تبدیل فوریه حرف بی صدای /s/ و در شکل (۱-۶) تبدیل فوریه حرف صدادار /e/ از کلمه seven نشان داده شده است. توجه کنید که در هر دوی این اصوات مخصوصا در حرف صدادار /e/ بعضی نواحی فرکانسی تقویت شده که به آنها نقاط تشدید می گوییم و در نواحی دیگر فرکانس ها تضعیف شده اند که به آنها غیر تشدید می گوییم. نواحی تشدید (فرکانس های تشدید) بستگی به شکل حفره صوتی دارند. در پردازش صوت به این فرکانس ها اصطلاحا فورمنت[۱۱] می گویند .
شکل۱-۳- حرف بی صداs
شکل۱-۴- حروف صدادار e
شکل ۱-۵- تبدیل فوریه حرف بی صدای s
شکل ۱-۶- تبدیل فوریه حرف صدا دار e
همانطور که ذکر شد گفتار به دو دسته کلی صدا دار و بی صدا تقسیم بندی می شود. با این حال علاوه بر این دو دسته، گفتار تولیدی، بر حسب تحریک اعمال شده، به چند طبقه جز ئی تر قابل تقسیم بندی است. صوت ممکن است همزمان صدادار و بی صدا باشد. به این گونه اصوات، مرکب[۱۲] می گویند. به عنوان مثال صدای حرف z در جمله three zebras از این نوع است. همچنین در بعضی حروف مثل t ابتدا یک گرفتگی کامل ایجاد می شود و در ادامه هوای جمع شده به یکباره از حفره دهانی خارج می شود. به اینگونه اصوات اصطلاحا انفجاری[۱۳] می گویند.
۱-۲- مفاهیم بهسازی گفتار :
در قالب یک تعریف کلی، موضوع بهسازی گفتار عبارت است از تلاش برای بهبود عملکرد سیستم‌های ارتباط گفتاری در مواردی که سیگنال گفتار تحت تأثیر نویز، انعکاس، و سایر عوامل تخریبی واقع گردیده است. نیاز به بهسازی گفتار از آنجا ناشی می‌شود که سیگنال گفتار :
- یا از منبعی تولید می‌شود که در محیط نویزی قرار دارد.
- یا تحت تأثیر کانال انتشار و در اثر نویز یا انعکاس[۱۴] دچار تخریب می‌شود.
- یا در گیرنده به نویز آلوده می‌شود.
- یا منشا عوامل نویز آلوده می‌شود.
- یا منشا نویز ترکیبی از سه حالت فوق است.
۱-۳- کاربرد های عمده بهسازی گفتار[۱۵]
بهسازی گفتار کاربردهای فراوانی دارد که عمده کاربردهای آن در موارد زیر می باشد:
سیستم های تلفن: که در آنها گفتار اصلی به وسیله نویز زمینه یا نویز موجود در مسیر مخابره و نیز در اثر انعکاس صدای طرفین مکالمه خراب می شود.
تلفن های عمومی: که در محیط­های پر سر و صدا و شلوغ واقعند.
سیستم های مخابرات هوا به زمین: که در آنها نویز اتاق خلبان، پیام ارسال شده از سوی خلبان را خراب می کند.
سمعک[۱۶]: که به عنوان یک تقویت کننده، هم سیگنال گفتار و هم نویز موجود در محیط را تقویت نموده و موجب ناراحتی کاربر می شود.
سیستم های بازشناسی گفتار یا گوینده[۱۷]: که معمولا برای سیگنال های تمیز (بدون نویز) آموزش یافته و در شرایط نویزی، با افتی شدید در بازدهی و کارایی مواجه می شود.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...