สิงห์กุล, สัตยา (2019) Deep Residual Local Feature Learning for Speech Emotion Recognition Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang
ปัจจุบันการรู้จําอารมณ์เสียงพูดมีความสําคัญอย่างมาก เพื่อใช้เพิ่มประสิทธิภาพการดําเนินธุรกิจ เช่น คอลเซ็นเตอร์ การ รู้จําอารมณ์เสียงพูดยังมีข้อท้าท้ายเช่นกัน ได้แก่ สภาพแวดล้อมที่รบกวนและประสิทธิภาพของแบบจําลอง ซึ่งมีผลต่อ การสกัดคุณลักษณะเด่นและประสิทธิภาพในการจําแนกอารมณ์ ดังนั้น จึงนําเสนอวิธีการเรียนรู้คุณลักษณะเด่นภายใน ส่วนที่เหลือ เพื่อให้แบบจําลองสามารถเรียนรู้คุณลักษณะเด่นได้อย่างมีประสิทธิภาพ โดยทํางานร่วมกับการคัดกรอง คุณลักษณะเด่นผ่านกระบวนการตรวจจับกิจกรรมเสียง เพื่อวิเคราะห์สภาพแวดล้อมและคัดเลือกลักษณะเสียงพูดที่มี ความสําคัญให้การรู้จําอารมณ์เสียงพูดมีประสิทธิภาพสูงสุด ซึ่งทําการวัดผมด้วยชุดข้อมูล RAVDESS ในเสียงพูด ภาษาอังกฤษ EMODB ในเสียงพูดภาษาเยอรมันจากเมืองเบอร์ลิน โดยผลลัพธ์ชี้ให้เห็นว่า การเรียนรู้คุณลักษณะเด่น ภายในส่วนที่เหลือเชิงลึก สามารถทํางานได้ดีกว่าวิธีในการเรียนรู้ที่ใช้เป็นคู่เปรียบเทียบ
Thai title:
Item Type:
Thesis (Bachelor)
Deposited by:
ระบบ อัตโนมัติ
Date Deposited:
2021-09-06 03:38:07
Last Modified:
2021-10-28 01:43:08