Научный журнал Кыргызстана

Taнг овогт Уoнг Хeнг
Taнг овогт Уoнг Хeнг
Tang Yong Heng

РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ОТЗЫВОВ КЛИЕНТОВ ПО ТЕКСТУ
ТЕКСТ БОЮНЧА КАРДАРЛАРДЫН ПИКИРЛЕРИН КЛАССИФИКАЦИЯЛООНУН НАТЫЙЖАЛАРЫ
RESULTS OF CLASSIFYING CUSTOMER COMMENTS BY TEXT

Целью данной статьи является проверка возможности классификации текста на положительное и отрицательное содержание на основе метода классификации текста путем публикации комментариев на монгольской кириллице. В результате мы посмотрели, сколько пользователей написали правильно и неправильно. В ходе исследования мы собрали комментарии разного значения, создали и использовали два словаря. Они сравнили плюсы и минусы. Была проведена статистическая ручная классификация, и алгоритм автоматической оценки был разработан и протестирован KNN и Naive Bayes. Точность метода KNN для классификации данных составляет 87,50 процента, а точность наивного метода Байеса - 87,50 процента. Данные и алгоритмы этого исследования могут послужить основой для дальнейших исследований по классификации монгольского кириллического текста на разные типы: сторона, правильная, неправильная, написание.
Бул макаланын максаты монгол кириллицасы менен комментарийлерди чыгарып, текстти классификациялоо ыкмасынын негизинде позитивдүү жана терс мазмуну боюнча классификациялоо мүмкүнчүлүгүн текшерүү болуп саналат. Иштин жыйынтыгында көптөгөн колдонуучулардын туура жана туура эмес жазылышын карадык. Изилдөө учурунда ар башка маанидеги комментарийлерин топтоп чыгып, эки сөздүктү түзүп, колдондук. Алар оң жана терс жактары салыштырылды. Статистикалык кол менен классификациялоо жүргүзүлүп, KNN жана Naive Bayes тарабынан автоматтык түрдө баалоо алгоритми иштелип чыгып, текшерилген. Маалыматтарды классификациялоо үчүн KNN методунун тактыгы 87,50 пайызды жана Naive Bayes ыкмасынын тактыгы 87,50 пайызды түзөт. Бул изилдөөдөгү маалыматтар жана алгоритмдер монгол кирилл текстин ар кандай түрлөргө классификациялоо боюнча андан аркы изилдөөлөргө негиз боло алат.
The purpose of this article tests whether it is possible to classify comments with Mongolian Cyrillic text into positive and negative comments based on the text classification method. As a result of the work, we collected comments from many users with correct and incorrect spellings as well as different meanings to created data of two parts: positive and negative. The statistical classification was also performed, and an automatic feedback grading algorithm was developed and tested by KNN and Naive Bayes. The accuracy of the KNN method for data classification is 87.50 percent and the accuracy of the Naive Bayes method is 87.50 percent. The data and algorithms created by this work will be the basis for further research to classify the Mongolian Cyrillic text into different types.

текст, метод сортировки, кириллица эмоция, классификация, положительная сторона, отрицательная сторона, правильный, неправильный, написание.
текст, иреттөө методу, кириллица эмоция, классификациялоо, оң жагы, терс жагы, туура, туура эмес, жазуу.
text, sorting method, cyrillic emotion, classification, positive side, negative side, correct, incorrect, spelling.

Taнг овогт Уoнг Хeнг, Сельскохозяйственный университет, г. Улан-Батор, Монголия.
Taнг овогт Уoнг Хeнг, Айыл чарба университети, Улан-Батор шаары, Монголия.
Tang Yong Heng, University of Life and Science, Ulan Bator, Mongolia.

Скачать

DOI:10.26104/IVK.2019.45.557

Новый выпуск

2024, №: 6

Известия ВУЗов Кыргызстана

Журналы

Контакты