فهرست:
تقدیر و تشکر. ث
چکیده. ح
فهرست شکل ها. س
فهرست جدول ها. ص
فصل اول: 1
مقدمه.. 1
1-1 پیشگفتار.. 1
1-2 بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم.. 2
1-3 تعریف مسئله و تقسیم بندی روش ها.. 3
1-4 نوآوری تحقیق.. 4
1-5 ساختار پایانامه.. 4
فصل دوم.. 5
پیش زمینه های پردازش سیگنال گفتار. 5
2-1 نحوه تولید گفتار در انسان.. 5
2-2 معرفی نویز و انواع آن.. 10
2-2-1 نویز سفید.. 13
2-2-2 نویز صورتی.. 13
2-2-3 نویز قهوهای.. 14
2-2-4 نویز صنعتی.. 14
2-3 تحلیل زمان- فرکانسی سیگنال گفتار.. 15
2-3-1 تبدیل فوریه.. 15
2-3-2 تبدیل فوریه زمان-کوتاه.. 17
2-3-3 آنالیز چند دقت زمان فرکانسی.. 20
2-3-4 تبدیل موجک یک بعدی.. 20
2-3-4-1 تبدیل موجک پیوسته. 20
2-3-4-1-1 دقت های زمانی و فرکانسی. 22
2-3-4-1-2 روابط ریاضی تبدیل موجک: 22
2-3-4-1-3 عکس تبدیل موجک: 24
2-3-4-2 تبدیل موجک گسسته. 24
2-4 الگوریتم بهینه سازی ژنتیک.. 28
2-4-1 درباره علم ژنتیک.. 28
2-4-2 تاریخچۀ علم ژنتیک.. 29
2-4-3 تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی 29
2-4-4 الگوریتم ژنتیک.. 32
2-4-5 مکانیزم الگوریتم ژنتیک.. 34
2-4-6 عملگرههای الگوریتم ژنتیک.. 37
2-4-6-1 کدگذاری. 37
2-4-6-2 ارزیابی. 37
2-4-6-3 ترکیب. 37
2-4-6-4 جهش. 37
2-4-6-5 رمزگشایی. 38
2-4-7 چارت الگوریتم به همراه شبه کد آن.. 38
2-4-7-1 شبه کد و توضیح آن.. 38
2-4-7-2 چارت الگوریتم ژنتیک.. 40
2-4-8 تابع هدف.. 41
2-4-9 روشهای کد کردن.. 41
2-4-9-1 کدینگ باینری. 42
2-4-9-2 کدینگ جایگشتی. 42
2-4-9-3 کد گذاری مقدار. 43
2-4-9-4 کدینگ درخت. 44
2-4-10 نمایش رشتهها.. 45
2-4-11 جمعیت.. 46
2-4-11-1 ایجادجمعیت اولیه. 46
2-4-11-2 اندازه جمعیت. 46
2-4-12 محاسبه برازندگی (تابع ارزش) 47
2-4-13 انواع روشهای انتخاب.. 48
2-4-13-1 انتخاب چرخ رولت. 49
2-4-13-2 انتخاب حالت پایدار. 51
2-4-13-3 انتخاب نخبه گرایی. 51
2-4-13-4 انتخاب رقابتی. 51
2-4-13-5 انتخاب قطع سر. 52
2-4-13-6 انتخاب قطعی بریندل. 52
2-4-13-7 انتخاب جایگزینی نسلی اصلاح شده. 53
2-4-13-8 انتخاب مسابقه. 53
2-4-13-9 انتخاب مسابقه تصادفی. 53
2-4-14 انواع روشهای ترکیب.. 53
2-4-14-1 جابهجایی دودوئی. 54
2-4-14-2 جابهجایی حقیقی. 56
2-4-14-3 ترکیب تکنقطهای. 57
2-4-14-4 ترکیب دو نقطهای. 58
2-4-14-5 ترکیب n نقطهای. 58
2-4-14-6 ترکیب یکنواخت. 58
2-4-14-7 ترکیب حسابی. 59
2-4-14-8 ترتیب. 59
2-4-14-9 چرخه. 60
2-4-15 احتمال ترکیب.. 60
2-4-16 تحلیل مکانیزم جابجایی.. 61
2-4-17 جهش.. 61
2-4-17-1 جهش باینری. 63
2-4-17-2 جهش حقیقی. 64
2-4-17-3 وارونه سازی بیت. 64
2-4-17-4 تغییر ترتیب قرارگیری. 64
2-4-17-5 وارون سازی. 64
2-4-17-6 تغییر مقدار. 65
2-4-18 محک اختتام اجرای الگوریتم ژنتیک.. 65
2-4-19 نقاط قوّت الگوریتمهای ژنتیک.. 66
2-4-20 محدودیتهای GAها.. 68
2-5 آنالیز ضرایب پیشگویی خطی (LPC) 69
2-5-1 محاسبه ضرایب LPC. 70
فصل سوم.. 73
مروری برروش های عمده بهسازی گفتار. 73
3-1 مقدمه.. 73
3-2 روش تفریق طیفی.. 74
3-3 روش فیلتر وینر.. 76
3-4 بهسازی گفتار با استفاده از مدل های آماری.. 78
3-4-1 تخمین زننده لگاریتمی بر مبنای کمینه کردن خطای میانگین مربعات(Log MMSE) 78
3-4-2 استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار.. 80
3-5 روش زیر فضای سیگنال.. 82
3-6 بهسازی گفتار با استفاده از تبدیل موجک.. 83
3-7 مقایسه روش ها و بررسی نقاط قوت و ضعف.. 85
3-7-1 بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار 86
2-3-2 چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف.. 87
3-8 نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار.. 89
3-8-1 استفاده از سیستم های ترکیبی.. 89
3-8-2 استفاده از پردازش های زیر باند و مزایای آن.. 89
3-8-3 استفاده از میکروفون دوم.. 90
فصل چهارم : روش های پیشنهادی... 92
4-1 مقدمه.. 92
4-2 روش های پیشنهادی.. 93
4-2-1 بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک.. 93
4-2-1-1 روش تفریق طیفی ضرایب موجک (WSS) 94
4-2-1-2 اصلاح روش تفریق طیفی ضرایب موجک (IWSS) 95
4-2-1-3 تخمین نویز. 96
4-2-1-4 الگوریتم ژنتیک. 97
4-2-1-4-1 عملگر انتخاب. 97
4-2-1-4-2 عملگر برش. 98
4-2-1-4-3 عملگر جهش. 98
4-2-1-4-4 جمعیت اولیه. 98
4-2-1-4-5 تابع هدف. 98
4-2-2 بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 98
4-2-2-1 تخمین زننده Log MMSE در فضای موجک. 99
4-2-2-2 تخمین نویز. 100
فصل پنجم: نتایج و آزمایش ها. 101
5-1 مقدمه.. 101
5-2 جزئیات پیاده سازی.. 102
5-3 نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک.. 103
5-4 نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 106
فصل ششم: نتیجه گیری و پیشنهادها. 109
6-1 نتیجه گیری.. 109
6-2 پیشنهاد برای کارهای آتی.. 111
مراجع 112
منبع:
[1] P.C. Loizou, Speech Enhancement: Theory and Practice, CRC Press,Boca Raton, FL, 2007.section 3, p 46
[2] Borden, G., Harris, K., and Raphael, L. , Speech science Primier, 3rd ed., Baltimore, MID: Williams and Wilkins.
[3] Rosenberg, A., Effect of glottal pulse shape on the quality of natural vowels, J. Acoust. Soc. Am., 49(2), 583-588 (1971).
[4] S. G. Mallat, "A Theory for Multiresolution Signal Decomposition: The Wavelet Representation," IEEE Transactions on Pattern Analysis Machine Intelligence, July 1989.
[5] ا. صیادی, "آشنایی مقدماتی با تبدیل ویولت ," دانشکده مهندسی برق، دانشگاه صنعتی شریف, اسفند87.
[6] C. S. Burrus, R. A. Gopinath and H. Guo, Introduction to Wavelets and the Wavelet Transforms: A Primer. Upper Saddle River, Prentice Hall, Inc., 1998.
[7] www.fa.wikipededia.org/wiki/ ژنتیک.htm
[8] www.en.wikipededia.org/wiki/Gergor_Mandel.htm
[9] 1387 انتشارت عابد، تهران، ، "الگوریتمهایژنتیک و بهینهسازی سازههای مرکب"،باوری ا ، صالحی م.
[10] www.fa.wikipededia.org/wiki/الگوریتم_ژنتیک.htm
[11] ، روزنامه جامجم- ضمیمه کلیک- شماره 209، تهران، "جستاری بر الگوریتمژنتیک"، شاهمیری ا 1387
[12] "آموزش کاربردی الگوریتمژنتیک در نرمافزار متلب " رضائی ع ، رنجبران س,1386،تهران، انتشارات آذر
[13] D.A Coley.,”An Introduction to genetic Algorithms for scientists and engineers “ , word scientific,2000
[14]Goldberg D.E,”Genetic Algorithms in Search Optimization and Machine Learning” ,Adisson Wesley Longman Inc.,1997.
[15] S. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Process, 1979.
[16] M. Berouti, R. Schwartz, and J. Makhoul, enhancement of speech corrupted by acoustic noise, proc. IEEE ICASSP , Washington DC, April 1979, 208-211.
[17] Zenton Goh, Kah-Chye Tan, B T G Tan,” Postprocessing Method for Suppressing Musical Noise Generated by Spectral Subtraction “IEEE trans. on Speech and Audio Processing 1998
[18] Bodin, P. and Villemoes, L. F. (1997). Spectral subtraction in the timefrequency domain using wavelet packets. IEEE Workshop on Speech Coding for Telecommunications. Proceedings, New York, IEEE, 47{48.
[19] Ing Yann Soon, Soo Ngee Koh, Chai Liat Yeo, Wavelet for Speech Denoising, TENCON 97, Brisbane, Australia, 1997, pp: 479-482.
[20] J. S . Lim and A. V. Oppenheim, “All-pole modeling of degraded speech,” IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-26, no. 3, pp. 197-210, June 1978.
[21] J. H. L. Hansen and M. A. Clements, “Constrained iterative speech enhancement with application to speech, recognition,” IEEE Trans. Signal Processing, vol. 39, no. 4, pp 795-805, Apr. 1991.
[22] W.-R. Wu and P.-C. Chen, “Subband Kalman Filtering for Speech Enhancement,” IEEE Transactions on Circuits and Systems II, vol. 45, no. 8, pp. 1072–1083, Aug. 1998.
[23] W.H. Chen, C.H. Smith, S.C. Fralick, A fast computational algorithm for the discrete cosine transform, IEEE Trans. Commun. COM-25 (1977) 1004±1009.
[24] Y. Ephraim and D. Malah, “Speech enhancement using a minimum mean-square error log-spectral amplitude estimator,” IEEE Trans. Acoustics, Speech and Signal Processing, vol. ASSP-33, pp. 443—445, 1985.
[25] K. E. Mueller, “Computing the confluent hypergeometric function, m(a, b, x),” Numer. Math., vol. 90, pp. 179—196, 2001.
[26] Philipos C. Loizou”Speech Enhancement: Theory and Practice, CRC Press,2007
[27] L. Rabiner and B. Juang, "An introduction to hidden Markov models," ASSP Magazine, IEEE, vol. 3, pp. 4-16, 1986.
[28] A. Varga and R. Moore, "Hidden Markov model decomposition of speech and noise," in Acoustics, Speech, and Signal Processing, 1990. ICASSP-90., 1990 International Conference on, 1990, pp. 845-848.
[29] H. Sameti, H. Sheikhzadeh, L. Deng, and R. L. Brennan, "HMM-based strategies for enhancement of speech signals embedded in nonstationary noise," Speech and Audio Processing, IEEE Transactions on, vol. 6, pp. 445-455, 1998.
[30] Y. Ephraim and H. L. Van Trees, "A signal subspace approach for speech enhancement," Speech and Audio Processing, IEEE Transactions on, vol. 3, pp. 251-266, 1995.
[31] J. Huang and Y. Zhao, "An energy-constrained signal subspace method for speech enhancement and recognition in white and colored noises," speech Communication, vol. 26, pp. 165-181, 1998.
[32] M. Rezaei and H. Gazor, "Generalized Vector Variational-Like Inequalities," Journal of Mathematical Extension, 2010.
[33] R. Vetter, "Single channel speech enhancement using MDL-based subspace approach in bark domain," in Acoustics, Speech, and Signal Processing, 2001. Proceedings.(ICASSP'01). 2001 IEEE International Conference on, 2001, pp. 641-644.
[34] D. L. Donoho and I. M. Johnstone, "Threshold selection for wavelet shrinkage of noisy data," in Engineering in Medicine and Biology Society, 1994. Engineering Advances: New Opportunities for Biomedical Engineers. Proceedings of the 16th Annual International Conference of the IEEE, 1994, pp. A24-A25 vol. 1.
[35] Q. Pan, L. Zhang, G. Dai, and H. Zhang, "Two denoising methods by wavelet transform," Signal Processing, IEEE Transactions on, vol. 47, pp. 3401-3406, 1999.
[36] H. Choi and R. Baraniuk, "Analysis of wavelet-domain Wiener filters," in Time-Frequency and Time-Scale Analysis, 1998. Proceedings of the IEEE-SP International Symposium on, 1998, pp. 613-616.
[37] J. Chen, Y. Huang, and J. Benesty, "Filtering techniques for noise reduction and speech enhancement," in Adaptive Signal Processing, ed: Springer, 2003, pp. 129-154.
[38] F. Asano, S. Hayamizu, T. Yamada, and S. Nakamura, "Speech enhancement based on the subspace method," Speech and Audio Processing, IEEE Transactions on, vol. 8, pp. 497-507, 2000.
[39] C. Avendano and G. Garcia, "STFT-based multi-channel acoustic interference suppressor," in Acoustics, Speech, and Signal Processing, 2001. Proceedings.(ICASSP'01). 2001 IEEE International Conference on, 2001, pp. 625-628.
[40] Y. Ghanbari, M.R. Karami, “Spectral subtraction in the wavelet domain for speech Enhancement”, International Journal of software and Information Technologies (IJSIT), vol.1 no.1, pp:26-30,2004.
[41] Malihe hassani, M. R. Karami mollaei,“Speech Enhancement Based on Spectral Subtraction in Wavelet Domain” IEEE 7th International Colloquium on Signal Processing and its Applications,2011.
[42] J. R. Deller, J. H. L. Hansen, and J.G. proakis, Discrete-time 8,19sson
gorithms in Search
processing of speech signals. 2nd edition, IEEE press, 2000.
[43] L. R. Rabiner and R. W. Schafer. Digital processing of speech signals. Prentice Hall, 1978.
[44] Tierney J., A study of LPC analysis of speech in additive noise, IEEE trans. Acoust. Speech and signal process., ASSP-28,4, pp:389-379 (Aug.1980).
[45] Sambur M.r. and Jayant N.s., LPC analysis/synthesis from speech inputs containing guantizing noise or additive white noise, IEEE Trans. Acoust. Speech and signal process., ASSP-24, 6, pp:488-494 (Dec.1976).
[46]Coley D.A.,”An Introduction to genetic Algorithms for scientists and engineers “ , word scientific,2000 [47]Goldberg D.E,”Genetic Algorithms in Search Optimization and Machine Learning” ,Adisson Wesley Longman Inc.,1997.