Добірка наукової літератури з теми "Класифікатор тексту"
Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями
Зміст
Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "Класифікатор тексту".
Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.
Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.
Статті в журналах з теми "Класифікатор тексту"
Погорілий, С. Д., та А. А. Крамов. "ЗАСТОСУВАННЯ МЕТОДІВ ОБРОБКИ ПРИРОДНОЇ МОВИ ДЛЯ ВИЯВЛЕННЯ СИМПТОМІВ МЕНТАЛЬНОГО ЗАХВОРЮВАННЯ". Medical Informatics and Engineering, № 1 (22 червня 2020): 8–16. http://dx.doi.org/10.11603/mie.1996-1960.2020.1.11125.
Повний текст джерелаБаязітов, М. Р., Д. М. Баязітов, А. Б. Бузиновський, А. В. Ляшенко, Д. В. Новіков та Л. С. Годлевський. "ПОРІВНЯЛЬНА ЕФЕКТИВНІСТЬ КЛАСИФІКАТОРІВ ЗОБРАЖЕНЬ ПІД ЧАС РОЗПІЗНАВАННЯ ЗОН ІНТЕРЕСУ ПРИ ЛАПАРОСКОПІЧНИХ ВТРУЧАННЯХ". Medical Informatics and Engineering, № 2 (13 липня 2020): 62–69. http://dx.doi.org/10.11603/mie.1996-1960.2020.2.11175.
Повний текст джерелаМироненко, С., та Є. Онищенко. "Порівняльний аналіз методів для вирішення задачі сентимент аналізу тексту." COMPUTER-INTEGRATED TECHNOLOGIES: EDUCATION, SCIENCE, PRODUCTION, № 40 (24 вересня 2020): 140–45. http://dx.doi.org/10.36910/6775-2524-0560-2020-40-21.
Повний текст джерелаІванченко, А. С., К. С. Бовсуновська, І. М. Дикан, Б. А. Тарасюк, В. А. Павлов та Є. А. Настенко. "КЛАСИФІКАТОР ДИФЕРЕНЦІАЛЬНОЇ ДІАГНОСТИКИ АУТОІМУННОГО ГЕПАТИТУ ТА ХВОРОБИ ВІЛЬСОНА НА ОСНОВІ АНАЛІЗУ УЛЬТРАЗВУКОВИХ ЗОБРАЖЕНЬ ПЕЧІНКИ". Біомедична інженерія і технологія, № 6 (17 листопада 2021): 62–73. http://dx.doi.org/10.20535/2617-8974.2021.6.233008.
Повний текст джерелаШумейко, О., В. С. Сотник, І. І. Жульковська та О. О. Жульковський. "ВИКОРИСТАННЯ МЕТОДІВ DATA MINING ДЛЯ ОБРОБКИ МОВНОЇ ІНФОРМАЦІЇ". Математичне моделювання, № 2(45) (13 грудня 2021): 48–57. http://dx.doi.org/10.31319/2519-8106.2(45)2021.246944.
Повний текст джерелаДавидько, О. Б., А. О. Ладік, В. Б. Максименко, М. І. Линник, О. В. Павлов та Є. А. Настенко. "КЛАСИФІКАЦІЯ УРАЖЕНЬ ЛЕГЕНЬ ПРИ COVID-19 НА ОСНОВІ ТЕКСТУРНИХ ОЗНАК ТА ЗГОРТКОВОЇ НЕЙРОННОЇ МЕРЕЖІ". Біомедична інженерія і технологія, № 6 (17 листопада 2021): 19–28. http://dx.doi.org/10.20535/2617-8974.2021.6.231887.
Повний текст джерелаКульбака, Н., A. Писаренко та O. Бондаренко. "Програмне забезпечення для віртуальних турів". Адаптивні системи автоматичного управління 2, № 39 (15 грудня 2021): 84–97. http://dx.doi.org/10.20535/1560-8956.39.2021.247415.
Повний текст джерелаGolub, T. V., I. Yа Zeleneva, S. S. Hrushko, and N. V. Lutsenko. "Software implementation of the automatic text classifier based on the specified method of forming a features space for categories." Telecommunication and information technologies 66, no. 1 (2020): 161–73. http://dx.doi.org/10.31673/2412-4338.2020.011673.
Повний текст джерелаДисертації з теми "Класифікатор тексту"
Блінков, Євген Миколайович. "Інформаційна технологія визначення тональності текстів". Bachelor's thesis, КПІ ім. Ігоря Сікорського, 2020. https://ela.kpi.ua/handle/123456789/39700.
Повний текст джерелаStructure and scope of work. The explanatory note of the diploma project consists of five sections, contains 26 figures, 7 tables, 1 appendix, 17 sources. The diploma project is devoted to automation of processes of the sentimental analysis of texts, applying various algorithms, and comparison of efficiency of these algorithms. This project describes the methods of sentimental analysis of texts and principles of their application in the development of information technology for text sentimental analysis. The information support section provided sets of input and output data, as well as described their format, structure and purpose in the software product. The section of mathematical support is primarily devoted to the description of meaningful and mathematical formulations of the problem, as well as key methods for solving the problem. In addition, the rationale for the choice of these methods for their implementation in the software product. The software section lists the development tools that have been used in this software product, as well as how the web application works in the form of various diagrams. The technological section provides user guidance for using this program, as well as describes the test results.
Бабич, Микола Валерійович. "Дослідження систем аналізу великих масивів неструктурованих даних". Master's thesis, Київ, 2018. https://ela.kpi.ua/handle/123456789/26806.
Повний текст джерелаThe work contains 85 pages, 20 illustrations, 14 table, 6 formulas and … sources. Relevance of the topic. According to experts, more than 85% of data is formed in an unstructured form. Unstructured data can include text, multimedia (video, voice, image), it is data that does not have a predefined structure, or not organized in the prescribed manner. All this leads to difficulty in analysis, especially when using traditional software that is designed to work with structured data. At all times, it is possible to find more interesting and potentially more valuable expert assessments, conclusions in unstructured data. Especially we see the rapid development of gadgets and IoT that form huge traffic flows that need to be processed. The topic of the master's thesis is relevant, because despite the rapid development of Big Data, technology is only at the beginning of its development, and with each passing year the number of questions only increases. In the processing of unstructured data, primarily interested in business, as the development of social networks the amount of actual unstructured content increases and handled manual information is not feasible. That is why researchers are faced with the question of automatic processing and classification of the text. The purpose of the thesis is to develop the algorithms for analysis of unstructured and poorly structured information and to create a text classifier using the SPSS Modeler simulation environment. In accordance with the stated goal, the following objectives were formulated: - to consider the basic algorithms of analysis of unstructured and poorly structured data; - to develop criteria for evaluating algorithms of unstructured and poorly structured data; - develop a text classifier based on the CRISP-DM process; - to implement the text classifier in the SPSS Modeler simulation environment; - test the model work. The object of research is an unstructured data. The subject of research are algorithms for analysis of unstructured and poorly structured data. Research methods. In the course of the work were used: methods of theoretical research, empirical approach, methods of logical design and procedural algorithmization, techniques of dynamic programming. Approbation of the results of the dissertation. The main results of the dissertation research was published during the iternational scientific and practical conference "Science and education: key issues of our time", 2018. (Chernihiv)
Іванов, Є. М., та Сергій Володимирович Коваленко. "Розробка web-додатка для аналізу тональності текстової інформації". Thesis, НТУ "ХПІ", 2017. http://repository.kpi.kharkov.ua/handle/KhPI-Press/38224.
Повний текст джерелаВівчарик, Володимир Михайлович, та Volodymyr Vivcharyk. "Визначення авторства документу з допомогою методів інтелектуального аналізу тексту". Master's thesis, 2019. http://elartu.tntu.edu.ua/handle/lib/30602.
Повний текст джерелаВ роботі досліджено основні завдання та можливі сфери застосування задачі визначення авторства деякого документу, обґрунтовано вибір моделі класифікації та програмного середовища Python для практичної реалізації методу визначення автора документу. Проведено тестування імплементованої класифікаційної моделі наївного Байєса для реальних даних, здійснено порівняння основних показників точності моделі для різного розміру простору ознак, проведено аналіз впливу на точність різних методів нормування текстових документів для задач класифікації.
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ, СИМВОЛІВ, ОДИНИЦЬ, СКОРОЧЕНЬ І ТЕРМІНІВ 11 ВСТУП 12 1 ФОРМАЛЬНІ МЕТОДИ АНАЛІЗУ ДАНИХ, НА ЯКИХ БАЗУЄТЬСЯ ВИЗНАЧЕННЯ АВТОРСТВА 14 1.1 Основні завдання та застосування науки про визначення авторства 14 1.2 Історія виникнення науки стилеметрії 15 1.3 Класифікація методів дослідження стилю написання текстів 17 1.4 Штучний інтелект 18 1.4.1 Нейронна мережа 20 1.4.2 Пошук та оптимізація 20 1.4.3 Логіка 21 1.4.4 Теорія управління 22 1.5 Машинне навчання 23 1.6 Класифікація 25 1.6.1 Метод k найближчих сусідів 25 1.6.2 Класифікатор наївного Байєса 27 1.6.3 Дерева рішень 30 1.6.4 Метод опорних векторів (SVM) 32 1.7 Висновки до першого розділу 34 2 ОСОБЛИВОСТІ ПОБУДОВИ ТА ОЦІНКИ ЯКОСТІ КЛАСИФІКАЦІЙНИХ МОДЕЛЕЙ ТЕКСТОВИХ ДОКУМЕНТІВ 35 2.1 Мульти-класифікація 35 2.2 Представлення текстових документів для аналізу 36 2.3 Зупинка слів (stopwords) 38 2.4 Стемінг (stemming) 39 2.5 Лематизація (Lemmatization) 42 2.6 Використання корисної інформації для зменшення розмірності ознак 43 2.7 Представлення текстових документів: побудова моделі векторного простору 44 2.8 Лексичні методи вилучення ключових слів 46 2.9 Нормалізація ваг 47 2.10 Вимірювання відстані між двома векторами 49 2.11 Оцінка текстового класифікатора 50 2.12 Висновки до розділу 2 52 3 ПРАКТИЧНА РЕАЛІЗАЦІЯ МЕТОДУ ІДЕНТИФІКАЦІЇ АВТОРА 53 3.1 Набір даних 53 3.2 Вибір програмного середовища 54 3.2.1 Бібліотека Scikit-learn 57 3.2.2 Бібліотека Pandas 59 3.2.3 Бібліотека NLTK 61 3.3 Підготовка середовища 61 3.4 Завантаження даних 63 3.5 Очищення та нормалізація даних 67 3.5.1 Скорочення простору атрибутів 69 3.5.2 Лематизація 70 3.5.3 Стеммінг 71 3.6 Побудова моделі класифікації 72 3.7 Оцінка точності методу класифікації 73 3.8 Висновки до розділу 3 74 4 СПЕЦІАЛЬНА ЧАСТИНА 75 4.1 Основні типи даних в Python 75 4.1.1 Булевий тип (bool) 75 4.1.2 Числа 76 4.1.3 Екрановані послідовності 77 4.1.4 Список (list) 77 4.1.5 Кортеж (tuple) 78 4.1.6 Словник (dict) 78 4.2 Структури даних Pandas 79 4.2.1 Структура даних Series 79 4.2.2 Структура даних DataFrame 80 4.3 Висновки до розділу 4 81 5 ОБҐРУНТУВАННЯ ЕКОНОМІЧНОЇ ЕФЕКТИВНОСТІ 82 5.1 Розрахунок норм часу на виконання науково-дослідної роботи 82 5.2 Визначення витрат на оплату праці та відрахувань на соціальні заходи 83 5.3 Розрахунок матеріальних витрат 86 5.4 Розрахунок витрат на електроенергію 87 5.5 Розрахунок суми амортизаційних відрахувань 88 5.6 Обчислення накладних витрат 89 5.7 Складання кошторису витрат та визначення собівартості науково-дослідницької роботи 89 5.8 Розрахунок ціни науково-дослідної роботи 90 5.9 Визначення економічної ефективності і терміну окупності капітальних вкладень 91 5.10 Висновки до розділу 5 92 6 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 93 6.1 Охорона праці 93 6.2 Безпека в надзвичайних ситуаціях 96 6.2.1 Фактори виробничого середовища і їх вплив на життєдіяльність людини 96 6.2.2 Підвищення стійкості роботи промислового підприємства в умовах впливу ЕМІ ядерних вибухів 99 6.3 Висновки до розділу 6 101 7 ЕКОЛОГІЯ 102 7.1 Зниження енергоємності та енергозбереження 102 7.2 Індексний метод в екології 104 7.3 Висновки до розділу 7 108 ВИСНОВКИ 109 БІБЛІОГРАФІЯ 110 ДОДАТКИ
Удовенко, С. Г., Л. Е. Чала та Є. С. Кушвид. "Програмна реалізація класифікатора неструктурованих електронних текстів". Thesis, 2017. http://openarchive.nure.ua/handle/document/7777.
Повний текст джерела