Text Detection and Recognition for Text-to-speech synthesis

249

Views

1

Downloads

ตันธีระพงศ์, ชญานิศ (2015) Text Detection and Recognition for Text-to-speech synthesis Bachelor thesis, King Mongkut's Institute of Technology Ladkrabang

Abstract

การตรวจจับข้อความและการรู้จําข้อความจากฉากธรรมชาติ มีหลากหลายปัจจัยที่ที่มีผลกระทบต่อการตรวจจับและรู้จํา เช่น มุมมองของภาพ , แสง ความหลากหลายของตัวอักษร และความคมชัดของภาพ เป็นต้น ถึงแม้ว่าจะมีวิธีการต่างๆ มากมายในการตรวจจับและรู้จําข้อความ แต่การที่จะสร้างระบบตรวจจับและรู้จําข้อความเพื่อแปลงเป็นเสียงพูดนั้น จําเป็นที่จะต้องได้ผลลัพธ์ที่มีความแม่นยําสูงเพื่อให้ง่ายต่อระบบการแปลงข้อความเป็นเสียงพูด นอกจากนี้การตรวจจับ และรู้จําข้อความ โดยเฉพาะภาษาไทยยังมีวิธีการที่รองรับภาษาไทยน้อย เพราะว่าโครงสร้างของภาษาไทยที่มีสระและ วรรณยุกต์นั้น ทําให้มีโครงสร้างที่แตกต่างจากภาษาอื่นๆ โดยรายงานนี้จะนําเสนอการพัฒนาระบบตรวจจับข้อความและ การรู้จําข้อความเพื่อแปลงเป็นเสียงพูด โดยมี 4 ขั้นตอนหลัก คือ 1) ตรวจจับวัตถุและแยกกลุ่มของตัวอักษรและกลุ่มที่ ไม่ใช่ตัวอักษร2), นํากลุ่มของตัวอักษรที่จับได้มารวมเป็นกลุ่มของข้อความพร้อมตรวจสอบว่าในกลุ่มข้อความนั้นมีกลุ่มที่ไม่ ใช้ข้อความหลงเหลืออยู่หรือไม่ 3), นํากลุ่มข้อความเข้ากระบวนการรู้จําข้อความ 4),นําผลลัพธ์ที่ได้มาแปลงเป็นเสียงพูด จากการทดลองพบว่าวิธีการที่พัฒนาสามารถตรวจจับและรู้จําข้อความเพื่อแปลงเป็นเสียงพูดได้ โดยมีความแม่นยําและ ครบถ้วนของภาษาไทยอยู่ที่ 0.84 และ 0.62 และค่าแม่นยําและค่าครบถ้วยสําหรับภาษาอังกฤษอยู่ที่ 0.87 และ 0.76

Thai title:

การตรวจจับและรู้จำข้อความเพื่อแปลงเป็นเสียงพูด

Item Type:

Thesis (Bachelor)

Deposited by:

ระบบ อัตโนมัติ

Date Deposited:

2021-09-06 03:38:04

Last Modified:

2021-09-06 03:38:04

Impact and Interest:

Presentation Video

Statistics