Please use this identifier to cite or link to this item:
https://rsuir-library.rsu.ac.th/handle/123456789/2491
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | กฤษฎา ศรีแผ้ว | - |
dc.date.accessioned | 2024-07-19T06:08:16Z | - |
dc.date.available | 2024-07-19T06:08:16Z | - |
dc.date.issued | 2558 | - |
dc.identifier.uri | https://rsuir-library.rsu.ac.th/handle/123456789/2491 | - |
dc.description.abstract | โครงการวิจัยพื้นฐานเพื่อพัฒนาโมเดลตรวจจับคำหยาบ เป็นโครงการที่จัดทำ ขึ้นเนื่องจากความเจริญเติบโตของสังคมออนไลน์และความแพร่หลายของเทคโนโลยีสารสนเทศ ที่ทำ ให้ผู้ใช้มีความเป็นอิสระมากขึ้นในการแสดงความคิดเห็น การโพสต์ข้อความ หรือการแบ่งปันความคิดเห็นสู่สาธารณะ ในเชิงบวกนั้นก่อให้เกิดการแสดงความคิดเห็นได้โดยเสรี และแพร่กระจายความคิดนั้นได้ง่ายและรวดเร็วเข้าถึงในระดับแต่ละบุคคล แต่ในอีกแง่มุมหนึ่ง คือ การแสดงความคิดเห็นในเชิงลบ อันจะก่อให้เกิดความเสียหาย ด่าทอ ให้ร้าย ใช้ถ้อยคำ หยาบคาย หรือหมิ่นประมาทบุคคลอื่น ก็สามารถเกิดขึ้นได้ง่ายเช่นกัน ดังจะพบเห็นได้จากปัญหาที่เกิดขึ้นในสังคมออนไลน์ในปัจจุบัน เพื่อเป็นการป้องกันปัญหาเหล่านี้ไม่ให้เกิดขึ้นซ้ำ แล้วซ้ำอีกหรือทวีความรุนแรงมากขึ้น ดังนั้นงานวิจัยนี้ จึงต้องการศึกษาคุณลักษณะและประเภทของความหยาบคายที่เกิดขึ้นในสังคมออนไลน์ไทย โดยรวบรวมข้อความในกระดานสนทนาสาธารณะมาวิเคราะห์สร้างเป็นคลังข้อมูล และศึกษาระบบการตรวจจับคำหยาบที่มีในสังคมออนไลน์ รวมถึงทำการพัฒนาโมเดลการตรวจจับคำหยาบภาษาไทย ที่รองรับการหลบเลี่ยงและการวิวัฒน์ทางภาษา และระดับความหยาบคายที่เปลี่ยนแปลงตามแต่ละสังคมออนไลน์ โดยใช้เทคนิคการทำเหมืองข้อมูล การเรียนรู้เครื่อง และการคำนวณทางภาษา โดยเป็นการทำงานร่วมกัน ของคณะวิจัยที่มีความเชี่ยวชาญทางด้านเทคโนโลยีสารสนเทศและทางด้านภาษาศาสตร์ ในท้ายที่สุดของงานวิจัยนี้ ผลลัพธ์ที่จะได้ คือ โมเดลการตรวจจับคำหยาบภาษาไทยที่มีประสิทธิภาพ และคลังข้อมูลมาตรฐานที่ใช้เป็นเกณฑ์ในการวิจัยด้านการตรวจจับคำหยาบภาษาไทยต่อไป | en_US |
dc.description.sponsorship | สถาบันวิจัย มหาวิทยาลัยรังสิต | en_US |
dc.language.iso | other | en_US |
dc.publisher | สถาบันวิจัย มหาวิทยาลัยรังสิต | en_US |
dc.subject | คลังข้อมูลภาษา | en_US |
dc.subject | ภาษาไทย -- การวิเคราะห์ -- การประมวลผลข้อมูล -- วิจัย | en_US |
dc.subject | ภาษาไทย -- คำหยาบ -- การประมวลผลข้อมูล | en_US |
dc.title | รายงานวิจัยฉบับสมบูรณ์ โครงการวิจัย การวิจัยพื้นฐานเพื่อพัฒนาโมเดลตรวจจับคำหยาบภาษาไทย | en_US |
dc.title.alternative | A fundamental research on developing Thai profanity detection mode | en_US |
dc.type | Other | en_US |
dc.description.other-abstract | A fundamental research on developing Thai profanity detection model is a project arising from the growth of social network and widespread of IT. This produces an independence of expressing the opinions, posting the messages, or sharing idea to the public. The advantage is to make individuals freely express their opinions and can distribute such opinions easily and rapidly. On the contrary, pessimistic opinion expressions which harms, revile, defame, profane or libel the others can also easily happen as we can see from the current social network. In order to avoid the repeat of such problem, this research then focuses to study the characteristic and category of profanity in the Thai social network. The messages in the public forums are gathered as a corpus. This work focuses not only the study of existing techniques for profanity detection in social network, but also the development of Thai profanity detection model. The model will support an avoidance of being profane by the writers and evolutionary of languages including a change of profanity level in each social network. The technique of data mining, machine learning and computational linguistics will be employed. Furthermore, experts in a field of IT and linguistics will be gathered as a research team. At the end, the results of this research will produce efficient Thai profanity detection model and standard corpus as a benchmark for further research on Thai profanity detection | en_US |
Appears in Collections: | ICT-Research |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
KRITSADA SRIPHAEW.pdf | 1.65 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.