Please use this identifier to cite or link to this item: https://rsuir-library.rsu.ac.th/handle/123456789/1520
Title: ผลกระทบของขนาดเคอร์เนลต่อภาพที่ปรับขนาดต่างกันในการรู้จำวัตถุบนพื้นฐานโครงข่ายประสาทคอนโวลูชัน
Other Titles: Impacts of kernel size on different resized images in object recognition based on convolutional neural network
Authors: ดนุพล จันทร์ทรง
metadata.dc.contributor.advisor: สิริพร ศุภราทิตย์
Keywords: ระบบสื่อสารไร้สาย;การรู้จำวัตถุ -- แบบจำลอง;;คอนโวลูชัน (คณิตศาสตร์);นิวรัลเน็ตเวิร์ด (คอมพิวเตอร์)
Issue Date: 2564
Publisher: มหาวิทยาลัยรังสิต
Abstract: งานวิจัยนี้มุ่งเน้นการศึกษาเกี่ยวกับผลกระทบของขนาดเคอร์เนลที่มีต่อภาพที่ปรับขนาดต่างกันโดยใช้โครงข่ายประสาทคอนโวลูชันในการรู้จำวัตถุ โดยใช้แบบจำลองสองชุดคือ Conv573 และ Conv3 ซึ่งใช้สถาปัตยกรรมแบบ Shallow Feed-Forward Network สาหรับการแยกคุณลักษณะโดยมีวัตถุประสงค์ในการประเมินเปรียบเทียบ Conv573 หมายถึงโครงข่ายประสาทคอนโวลูชันที่มีขนาดเคอร์เนล 7×7, 5×5 และ 3×3 ในขณะที่ Conv3 มีขนาดเคอร์เนล 3×3 เท่านั้น โดยที่ คอนโวลูชันเลเยอร์ 3 ชั้น และ 2 ชั้น นั้นเทียบเคียงได้กับ คอนโวลูชันเลเยอร์ 1 ชั้นที่มีขนาดเคอร์เนล 7×7 และ5×5 ตามลำดับ การทดลองใช้ชุดข้อมูลภาพ CIFAR-10 ที่ปรับขนาดต่างกันได้แก่ 50×50 พิกเซล ,100×100 พิกเซล และ 150×150 พิกเซล ในการทดสอบกับโมเดลทั้งสองแบบ เพื่อวัตถุประสงค์ในการลดอคติ ในการประเมินประสิทธิภาพการรู้จำวัตถุจะขึ้นอยู่กับค่าเฉลี่ยของค่า ความแม่นยำ ผลทำนาย (Precision) , การวัดความแม่นยำ (Recall), F1 และ อัตราความถูกต้อง (Accuracy Rates)โดยพิจารณาจากการตรวจสอบความถูกต้อง 10-Fold Cross Validation ผลการวิจัยระบุว่ายิ่งภาพมีขนาดใหญ่เท่าใดความแม่นยำ ในการจดจำจะขึ้นอยู่กับโมเดล Conv573 ในทางกลับกันสำหรับโมเดล Conv3 ความแม่นยำ ในการรับรู้ 2.65% และ 0.06% ดีขึ้นสำหรับโมเดล Conv573 ในขณะที่ประสิทธิภาพลดลง 0.39% และ 1.76 สำหรับโมเดล Conv3 จะให้ผลตามลำดับเมื่อปรับขนาดรูปภาพจาก 50×50 พิกเซล เป็น 100×100 พิกเซล และจาก 100×100 เป็น 150×150 สำหรับรูปภาพที่ปรับขนาด 50×50 และ 100×100 ในโมเดล Conv3 ให้ความแม่นยำ เฉลี่ยดีกว่า Conv573 เป็น 4.74%และ 1.64% อย่างไรก็ตามโมเดล Conv573 มีความแม่นยำเฉลี่ยดีกว่าโมเดล Conv3 เป็น 0.18% เมื่อปรับขนาดเป็น 150×150
metadata.dc.description.other-abstract: This research focuses on the impacts of kernel sizes on different resized images relying on a convolutional neural network (CNN) for object recognition. Two sets of convolutional neural network (CNN) deep learning models: Conv573 and Conv3, based on shallow feed-forward-architecture networks, are employed here for feature extraction with comparative assessment purposes. The Conv573 refers to CNN with a kernel size of 7×7, 5×5, and 3×3. At the same time, the Conv3 represents that of only 3×3 kernel size where three and two convolutional layers of 3×3 kernel size are consecutively comparable to one convolutional layer of 7×7 and 5×5 kernel sizes. The experiments rely on different-resized CIFAR-10 image datasets, 50×50, 100×100, and 150×150 pixels for testing with the Conv573 and Conv3 models. For bias reduction, recognition performance assessments depend on averages of precision, recall, F1, and accuracy rates, based upon 10-fold cross-validation. The results indicate that the greater the size of an image is, the better the recognition accuracy would be based on Conv573, conversely for Conv3. 2.65% and 0.06% recognition accuracy improvement based on Conv573, whereas 0.39% and 1.76% performance decrease based on Conv3 are respectively yielded when resizing an image from 50×50 to 100×100 and from 100×100 to 150×150. For 50×50 and 100×100 resized images, Conv3 yields 4.74% and 1.64% better averaged accuracy than Conv573; nevertheless, Conv573 generates 0.18% better averaged accuracy than Conv3 on 150×150 resized ones.
Description: วิทยานิพนธ์ (วท.ม. (เทคโนโลยีสารสนเทศ)) -- มหาวิทยาลัยรังสิต, 2564
metadata.dc.description.degree-name: วิทยาศาสตรมหาบัณฑิต
metadata.dc.description.degree-level: ปริญญาโท
metadata.dc.contributor.degree-discipline: เทคโนโลยีสารสนเทศ
URI: https://rsuir-library.rsu.ac.th/handle/123456789/1520
metadata.dc.type: Thesis
Appears in Collections:ICT-IT-M-Thesis

Files in This Item:
File Description SizeFormat 
LIEUTENANT JUNIOR GRADE DANUPON CHANSONG.pdf5.52 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.