Thai Emotional Speech Feature Extraction

172

Views

0

Downloads

แซ่หวาง, สิปปวิชญ์ and สกลพิสิษฐ์, ณิธยาน์ (2016) Thai Emotional Speech Feature Extraction Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang

Abstract

ปัจจุบันในการรู้จําอารมณ์จากเสียงพูดได้กลายเป็นส่วนหนึ่งของการสื่อสารระหว่างมนุษย์กับคอมพิวเตอร์ ซึ่ง คอมพิวเตอร์สามารถรับรู้ได้ว่า ผู้สื่อสารมีอารมณ์อย่างไรในการปฏิสัมพันธ์ และมีการพัฒนาอย่างต่อเนื่องเพื่อการใช้งาน ที่หลากหลาย เช่น ในการวิเคราะห์อารมณ์ของผู้เรียนจากระบบการศึกษาทางไกล หรือการประเมินสุขภาพจิตของผู้ป่วย ในโรงพยาบาล โดยมีปัญหาที่พบคือ (1) เสียงพูดของมนุษย์โดยทั่วไป มีเสียงรบกวนอื่น ๆ ปนอยู่กับเนื้อเสียงจริง ทําให้ ส่งผลต่อการรู้จําของคอมพิวเตอร์ จึงนําเสนอวิธีแก้ปัญหาโดยการพัฒนาวิธีตัดเสียงรบกวนออกจากเนื้อเสียงจริงโดยใช้ ความแปรปรวนของบริบทของเสียงพูด และ (2) ในการจําแนกอารมณ์ ได้พบว่ากลุ่มของอารมณ์นั้นมีความคลุมเครือ เช่น อารมณ์โกรธที่มีความเฉื่อยชา และอารมณ์เศร้า ส่งผลให้การจําแนกอารมณ์มีความคลาดเคลื่อนได้ จึงนําเสนอวิธี แก้ปัญหาโดยการพัฒนาวิธีการรู้จําเสียงพูดให้เป็นวิธีจําแนกแบบสองระดับ เมื่อใช้วิธีการแก้ปัญหาดังกล่าว กับคลังข้อมูล ของ Emotional speech Corpus from Lakorn (EMOLA) จากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) ซึ่งได้ผลการรู้จําของอารมณ์ด้วยวิธีการที่นําเสนอให้ผลลัพธ์สูงกว่าวิธีการที่นํามาเปรียบเทียบ

Thai title:

การคัดกรองอารมณ์จากเสียงพูดภาษาไทย

Item Type:

Thesis (Bachelor)

Deposited by:

ระบบ อัตโนมัติ

Date Deposited:

2021-09-06 03:38:05

Last Modified:

2021-09-06 03:38:05

Impact and Interest:

Presentation Video

Statistics