แซ่หวาง, สิปปวิชญ์ and สกลพิสิษฐ์, ณิธยาน์ (2016) Thai Emotional Speech Feature Extraction Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang
ปัจจุบันในการรู้จําอารมณ์จากเสียงพูดได้กลายเป็นส่วนหนึ่งของการสื่อสารระหว่างมนุษย์กับคอมพิวเตอร์ ซึ่ง คอมพิวเตอร์สามารถรับรู้ได้ว่า ผู้สื่อสารมีอารมณ์อย่างไรในการปฏิสัมพันธ์ และมีการพัฒนาอย่างต่อเนื่องเพื่อการใช้งาน ที่หลากหลาย เช่น ในการวิเคราะห์อารมณ์ของผู้เรียนจากระบบการศึกษาทางไกล หรือการประเมินสุขภาพจิตของผู้ป่วย ในโรงพยาบาล โดยมีปัญหาที่พบคือ (1) เสียงพูดของมนุษย์โดยทั่วไป มีเสียงรบกวนอื่น ๆ ปนอยู่กับเนื้อเสียงจริง ทําให้ ส่งผลต่อการรู้จําของคอมพิวเตอร์ จึงนําเสนอวิธีแก้ปัญหาโดยการพัฒนาวิธีตัดเสียงรบกวนออกจากเนื้อเสียงจริงโดยใช้ ความแปรปรวนของบริบทของเสียงพูด และ (2) ในการจําแนกอารมณ์ ได้พบว่ากลุ่มของอารมณ์นั้นมีความคลุมเครือ เช่น อารมณ์โกรธที่มีความเฉื่อยชา และอารมณ์เศร้า ส่งผลให้การจําแนกอารมณ์มีความคลาดเคลื่อนได้ จึงนําเสนอวิธี แก้ปัญหาโดยการพัฒนาวิธีการรู้จําเสียงพูดให้เป็นวิธีจําแนกแบบสองระดับ เมื่อใช้วิธีการแก้ปัญหาดังกล่าว กับคลังข้อมูล ของ Emotional speech Corpus from Lakorn (EMOLA) จากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) ซึ่งได้ผลการรู้จําของอารมณ์ด้วยวิธีการที่นําเสนอให้ผลลัพธ์สูงกว่าวิธีการที่นํามาเปรียบเทียบ
Thai title:
Item Type:
Thesis (Bachelor)
Deposited by:
ระบบ อัตโนมัติ
Date Deposited:
2021-09-06 03:38:05
Last Modified:
2021-09-06 03:38:05