ใจตรง, บุษบงก์ and ขุนพารเพิง, เขตโสภณ (2020) Identifying and Recognizing Bird Species Using Continuous Soundscapes from Omnidirectional Bioacoustic Recordings Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang
การระบุสายพันธุ์ของนกด้วยเสียงถือเป็นวิธีการที่มีประสิทธิภาพมากกว่าการใช้รูปถ่ายของนกเนื่องจากการถ่ายภาพนกใน สถานที่ต่าง ๆ ให้คมชัดและ ได้จํานวนที่มากพอต่อการนําไปใช้ฝึกแบบจําลองถือเป็นเรื่องที่ยากลําบากงานวิจัยฉบับนี้จึงมุ่งเน้นการ ประมวลผลข้อมูลก่อนนําไปสร้างแบบจําลอง และการสร้างแบบจําลองโครงข่ายประสาทเชิงลึกแบบคอนโวลูชัน (Deep Convolutional Neural Network) เพื่อใช้ในการทํานายข้อมูลเสียงของนกแต่ละสายพันธุ์ โดยมีการนําเทคนิคการสกัดข้อมูลเสียง (Audio feature Extraction) ซึ่งประกอบไปด้วยคุณลักษณะต่าง ๆ เช่น Chroma STFT, RMSE, Zero-Crossing Rate และ MFCC เป็นต้น มาใช้ในการประมวลผลข้อมูลเพื่อนําไปใช้ในแบบจําลองโครงข่ายประสาทเทียม (Multi-layer Perceptron)และได้มีการนํา เทคนิคการสร้างคุณลักษณะจากคลื่นความถี่เสียง (Spectrogram Feature Generation) มาใช้ในการประมวลผลข้อมูลด้วย ซึ่งก่อน การสร้างคุณลักษณะจากคลื่นความถี่เสียงได้ใช้เทคนิคการประมวลผลภาพทางสัณฐานวิทยา (Morphological Image Processing) ในการแยกสัญญาณเสียงที่ใช้ในการฝึกแบบจําลองออกจากเสียงสัญญาณรบกวนก่อนที่จะนําไปใช้ในการฝึกแบบจําลอง โดยใช้ สถาปัตยกรรมต่าง ๆ ของแบบจําลองโครงข่ายประสาทแบบคอนโวลูชัน (Convolutional Neural Network) ได้แก่สถาปัตยกรรม AlexNet, VGG16, inception-v3, inception-v4 และสถาปัตยกรรม Xception มาใช้ในการทํานายสายพันธุ์ของนก โดยแบ่งการ ทดลองออกเป็น 2 แบบใหญ่ ๆ ตามวิธีการประมวลข้อมูลก่อนนําไปเข้าแบบจําลอง และนําค่าความถูกต้อง (Accuracy) และค่าความ แม่นยําเฉลี่ย (Mean Average Precision) มาใช้ในการวัดผลความถูกต้องในการตรวจจับเสียงนกแต่ละสายพันธุ์ และวัดประสิทธิภาพ การทํางานของแบบจําลอง แล้วนํามาปรับปรุงแก้ไขการประมวลผลภาพก่อนนําเข้าแบบจําลอง และมีการใช้สถาปัตยกรรม CNN แบบ ต่าง ๆ จนได้ผลลัพธ์ที่ดีพอจนสามารถนํากระบวนการข้างต้นไปใช้กับข้อมูลเสียงของนกที่มีความหลากหลายสายพันธุ์ที่มากขึ้นต่อไป
Thai title:
Item Type:
Thesis (Bachelor)
Deposited by:
ระบบ อัตโนมัติ
Date Deposited:
2021-09-06 03:38:08
Last Modified:
2021-09-06 03:38:08