مباحث ویژه 2 - جلسه 18 (پردازش صوت در RNNها)

1,470
ابتدا با مفهوم صوت و مفهوم spectogram به عنوان ویژگی با معنی برای صوت آشنا شدیم. سپس برای بازشناسی گفتار دو روش بر پایه attention و CTC loss خلاصه بیان شد. در انتهای جلسه trigger word detection به عنوان یک مساله ساده شده صوت را معرفی کردیم و راهکار آموزش آن بیان شد. در ادامه پیاده سازی یک RNN حساس به کلمه ای خاص را پیاده سازی کردیم.
pixel