Deep Residual Local Feature Learning for Speech Emotion Recognition

372

Views

0

Downloads

สิงห์กุล, สัตยา (2019) Deep Residual Local Feature Learning for Speech Emotion Recognition Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang

Abstract

ปัจจุบันการรู้จําอารมณ์เสียงพูดมีความสําคัญอย่างมาก เพื่อใช้เพิ่มประสิทธิภาพการดําเนินธุรกิจ เช่น คอลเซ็นเตอร์ การ รู้จําอารมณ์เสียงพูดยังมีข้อท้าท้ายเช่นกัน ได้แก่ สภาพแวดล้อมที่รบกวนและประสิทธิภาพของแบบจําลอง ซึ่งมีผลต่อ การสกัดคุณลักษณะเด่นและประสิทธิภาพในการจําแนกอารมณ์ ดังนั้น จึงนําเสนอวิธีการเรียนรู้คุณลักษณะเด่นภายใน ส่วนที่เหลือ เพื่อให้แบบจําลองสามารถเรียนรู้คุณลักษณะเด่นได้อย่างมีประสิทธิภาพ โดยทํางานร่วมกับการคัดกรอง คุณลักษณะเด่นผ่านกระบวนการตรวจจับกิจกรรมเสียง เพื่อวิเคราะห์สภาพแวดล้อมและคัดเลือกลักษณะเสียงพูดที่มี ความสําคัญให้การรู้จําอารมณ์เสียงพูดมีประสิทธิภาพสูงสุด ซึ่งทําการวัดผมด้วยชุดข้อมูล RAVDESS ในเสียงพูด ภาษาอังกฤษ EMODB ในเสียงพูดภาษาเยอรมันจากเมืองเบอร์ลิน โดยผลลัพธ์ชี้ให้เห็นว่า การเรียนรู้คุณลักษณะเด่น ภายในส่วนที่เหลือเชิงลึก สามารถทํางานได้ดีกว่าวิธีในการเรียนรู้ที่ใช้เป็นคู่เปรียบเทียบ

Thai title:

การเรียนรู้คุณลักษณะเด่นภายในแบบส่วนที่เหลือเชิงลึก สำหรับการรู้จำอารมณ์เสียงพูด

Item Type:

Thesis (Bachelor)

Deposited by:

ระบบ อัตโนมัติ

Date Deposited:

2021-09-06 03:38:07

Last Modified:

2021-10-28 01:43:08

Impact and Interest:

Presentation Video

Statistics