Latest Post
การรู้จำลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียม
Thai Handwritten Character Recognition by Artificial Neural Networks
กาญจนา เรื่องธนานุรักษ์
ณัฐธิดา ลีสม
โอฬาริก สุรินต๊ะ
บทคัดย่อ
การรู้จำลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียม ได้เก็บรวบรวมข้อมูลตัวอักษรลายมือเขียนภาษาไทยจำนวน 100 ชุดต่อตัวอักษร จากผู้เขียนจำนวน 10 คน เพื่อนำมาเข้าสู่กระบวนการทางการวิจัย ประกอบด้วย การประมวลผลภาพเบื้องต้น การหาคุณลักษณะพิเศษของรูปภาพลายมือเขียนภาษาไทย และการรู้จำด้วยโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับ โดยที่กระบวนการหาคุณลักษณะพิเศษเป็นกระบวนการที่สำคัญ เนื่องจากช่วยเพิ่มประสิทธิภาพในการรู้จำ งานวิจัยฉบับนี้ได้นำเสนอคุณลักษณะพิเศษ 7 วิธีคือ การหาความหนาแน่น การหาจุดสิ้นสุดของตัวอักษร การหาตำแหน่งหัวของตัวอักษร การหารหัสลูกโซ่ การหาเส้นสมมุติในแนวนอนและแนวตั้ง การหาทิศทาง และการสแกนในแนวนอนและแนวตั้ง คุณลักษณะพิเศษทั้ง 7 วิธีที่ใช้กับข้อมูลตัวอักษรลายมือเขียนภาษาไทยในงานวิจัยนี้ประกอบด้วย 235 คุณลักษณะ ส่งผลให้
Thai Handwritten Character Recognition
Grey Image
Binary Image
Noise Reduction
Line Segmentation
Character Segmentation
Thinning
Feature Extraction
Artificial Neural Networks
Evaluation
Character Recognition Evaluated
Optimal Hidden Node
OCR Program GUI
Thai Handwritten Character Recognition by Artificial Neural Networks
กาญจนา เรื่องธนานุรักษ์
ณัฐธิดา ลีสม
โอฬาริก สุรินต๊ะ
บทคัดย่อ
การรู้จำลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียม ได้เก็บรวบรวมข้อมูลตัวอักษรลายมือเขียนภาษาไทยจำนวน 100 ชุดต่อตัวอักษร จากผู้เขียนจำนวน 10 คน เพื่อนำมาเข้าสู่กระบวนการทางการวิจัย ประกอบด้วย การประมวลผลภาพเบื้องต้น การหาคุณลักษณะพิเศษของรูปภาพลายมือเขียนภาษาไทย และการรู้จำด้วยโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับ โดยที่กระบวนการหาคุณลักษณะพิเศษเป็นกระบวนการที่สำคัญ เนื่องจากช่วยเพิ่มประสิทธิภาพในการรู้จำ งานวิจัยฉบับนี้ได้นำเสนอคุณลักษณะพิเศษ 7 วิธีคือ การหาความหนาแน่น การหาจุดสิ้นสุดของตัวอักษร การหาตำแหน่งหัวของตัวอักษร การหารหัสลูกโซ่ การหาเส้นสมมุติในแนวนอนและแนวตั้ง การหาทิศทาง และการสแกนในแนวนอนและแนวตั้ง คุณลักษณะพิเศษทั้ง 7 วิธีที่ใช้กับข้อมูลตัวอักษรลายมือเขียนภาษาไทยในงานวิจัยนี้ประกอบด้วย 235 คุณลักษณะ ส่งผลให้
ประสิทธิภาพการรู้จำลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียมถูกต้องคิดเป็นร้อยละ 87
คำสำคัญ: การรู้จำรูปแบบ, การรู้จำตัวอักษร, โครงข่ายประสาทเทียม, การตัดแยกตัวอักษร, คุณลักษณะพิเศษของตัวอักษรลายมือเขียนภาษาไทย
Abstract
The purpose of this research is to present the Thai handwritten character recognition by artificial neural networks. 100 collections of Thai handwritten characters were collected from 10 writers. The data are then analyzed using pre-processing feature extraction and recognition by back-propagation neural network. However, the feature extraction method is aimed to identify the intensity of black pixel, end of character, head of character, chain code, cross horizontal and vertical line, mark direction, and horizontal and vertical scanning. From the feature extraction, it was found that there are 235 features. Seven feature extraction methods provide the efficacy of Thai handwritten recognition. In addition, back-propagation neural network provide the Thai handwritten recognition accuracy of 87%
keywords: Pattern Recognition, Character Recognition, Artificial Neural Network, Character Segmentation, Feature Extraction of Thai Handwritten
Presentation
Thai Handwritten Character Recognition
Grey Image
Binary Image
Noise Reduction
Line Segmentation
Character Segmentation
Thinning
Feature Extraction
Artificial Neural Networks
Evaluation
Character Recognition Evaluated
Optimal Hidden Node
OCR Program GUI
Abstract
Feature extraction techniques can be important in character recognition, because they can enhance the efficacy
of recognition in comparison to featureless or pixel-based approaches. This study aims to investigate the novel feature extraction technique called the hotspot technique in order to use it for representing handwritten characters and digits. In the hotspot technique, the distance values between the closest black pixels and the hotspots in each direction are used as representation for a character. The hotspot technique is applied to three data sets including Thai handwritten characters (65 classes), Bangla numeric (10 classes), and MNIST (10 classes). The hotspot technique consists of two parameters including the number of hotspots and the number of chain code directions. The data sets are then classified by the k-Nearest Neighbors algorithm using the Euclidean distance as function for computing distances between data points. In this study, the classification rates obtained from the hotspot, mark direction, and direction of chain code techniques are compared. The results revealed that the hotspot technique provides the largest average classification rates.
keywords
Handwritten Character Recognition, Feature Extraction, k-Nearest Neighbors, Classification
Conference Sitevilamoura, Algarve, Portugal
วีดีโอเรื่อง "เทคนิคการนำเสนอ" บรรยายพิเศษโดยอาจารย์ ชรรชรีภรณ์ เวฬุวนารักษ์ อาจารย์ประจำสาขาวิชาการสื่อสารมวลชน คณะวิทยาการสารสนเทศ มหาวิทยาลัยมหาสารคาม
สามารถรับชมวีดีโอทั้งหมดจำนวน 10 วีดีโอ ดังจากลิงก์ดังต่อไปนี้
http://www.youtube.com/playlist?p=PLAFFEDD35FAEA9B56
สามารถรับชมวีดีโอทั้งหมดจำนวน 10 วีดีโอ ดังจากลิงก์ดังต่อไปนี้
http://www.youtube.com/playlist?p=PLAFFEDD35FAEA9B56
การสร้างสื่อการสอนด้วยโปรแกรม Authorware 7.0
สามารถเข้าชมวีดีโอ "การสร้างสื่่อการสอนด้วยโปรแกรม Authorware 7.0" ทั้งหมดได้จากลิงก์ต่อไปนี้ http://www.youtube.com/playlist?p=PL45EF991C74E81B21
สามารถเข้าชมวีดีโอ "การสร้างสื่่อการสอนด้วยโปรแกรม Authorware 7.0" ทั้งหมดได้จากลิงก์ต่อไปนี้ http://www.youtube.com/playlist?p=PL45EF991C74E81B21
ตัวอย่างการเขียน ASP.NET ด้วยใช้ Visual Studio 2008 เป็นเครื่องมือ และใช้ภาษา C# ในการเขียนโปรแกรม โดยเชื่อมต่อกับฐานข้อมูลจาก SQL Server
สามารถเข้าชมวีดีโอทั้งหมดที่เกี่ยวกับ Visual studio & web application with c# ได้จากลิงก์ต่อไปนี้ http://www.youtube.com/playlist?p=PL04AC36FE5A17B55E
สามารถเข้าชมวีดีโอทั้งหมดที่เกี่ยวกับ Visual studio & web application with c# ได้จากลิงก์ต่อไปนี้ http://www.youtube.com/playlist?p=PL04AC36FE5A17B55E
Subscribe to:
Posts (Atom)
Labels
- ASP.NET
- Authorware 7.0
- Course Syllabus
- Fundamentals of Computer Science (Funda)
- Information and Communication Technology Research
- Information and Knowledge Management (IKM)
- Information Technology Applications (ITA)
- Information Technology for Management (IT)
- Information Technology Management (ITM)
- Internet and Communication in Daily Life (Internet)
- Management Information System for Administrator
- Management Information Systems (MIS)
- Management Information Technology
- My Publications
- My Research Interests
- Office Automation Information Systems (Office)
- Palm Leaf Manuscript
- Publication 2007
- Publication 2009
- Publication 2012
- Seminar
- Thai Handwritten Character Recognition
- Web Development (WebDev)
- Web Programming for Information Work 1 (Web App)