Добірка наукової літератури з теми "Статистичний аналіз тексту"

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "Статистичний аналіз тексту".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Статті в журналах з теми "Статистичний аналіз тексту"

1

Tereshchenko, Liliia, та Svitlana Gladio. "Неправдивість письмового тексту: шляхи її визначення". PSYCHOLINGUISTICS 31, № 2 (4 березня 2022): 116–36. http://dx.doi.org/10.31470/2309-1797-2022-31-2-116-136.

Повний текст джерела
Анотація:
Мета. Виявлення шляхом емпіричного дослідження вербальних ознак неправдивості або правдивості письмового тексту на матеріалі рідної (української) та першої іноземної (англійської) мов. Методи. Учасниками емпіричного психолінгвістичного дослідження стали 200 студентів, котрі отримали завдання створити українською або англійською мовами два описи подій: один правдивий, а інший – неправдивий на ту ж тему. У загальному було проаналізовано 15 показників, які можуть свідчити про неправдивість письмового тексту. Для виявлення статистично значимої різниця застосовано t-критерій Стьюдента та Т-критерій Вілкоксона, для виявлення залежності між показниками – кореляційний аналіз Спірмена. Результати. Проведене дослідження підтвердило, що незалежно від мови (української чи англійської) правдиві тексти довші за неправдиві у більшості випадків, вони також більше наповнені емотивно-сенсорними та просторовими деталями, містять чисельні згадки особи мовця (самореференцію), натомість неправдиві тексти частіше актуалізують відмінні від правдивих домінуючі концепти. При аналізі англійських текстів, написаних українськими студентами, підтвердились наступні критерії неправдивості писемного мовлення: “лексичне розмаїття” мовлення; нерелевантність та надлишковість певної інформації, повтори; менша кількість числівників. Окремо підтверджено, що для українських неправдивих письмових текстів властиві порушення хронології подій та невиправдані контекстом зміни наративної перспективи. Не знайшли значимого статистичного підтвердження неправдивості писемного мовлення для обох мов такі ознаки: співвідношення довжини прологу щодо довжини всього тексту; наявність модифікуючих прислівників; наявність двозначних або неоднозначних, неконкретних номінацій; спонтанні виправлення на письмі; частотність вживання займенників першої особи множини та третьої особи однини і множини. Висновки. Існує низка вербальних ознак, за якими неправдивий письмовий текст відрізняється від правдивого, не зважаючи на той факт, що за своєю природою неправдиве мовлення є прихованим кодом та імітацією будь-якого типу правдивого мовлення. Однак ці критерії частково різняться для текстів, написаних українською та англійською мовами.
Стилі APA, Harvard, Vancouver, ISO та ін.
2

Ochanina, Anastasia. "ПОРIВНЯЛЬНО-ЛIНГВIСТИЧНИЙ ПIДХIД ІНТЕРПРЕТАЦІЇ ОБРАЗУ ЕВРІДІКИ З ОПЕРИ «ОРФЕЙ ТА ЕВРІДІКА» K. B. ГЛЮКА У ФРАНКО ТА ІТАЛОМОВНИХ РЕДАКЦІЯХ ЛІБРЕТО". Музичне мистецтво і культура 2, № 32 (11 січня 2022): 103–19. http://dx.doi.org/10.31723/2524-0447-2021-32-2-9.

Повний текст джерела
Анотація:
Мета роботи полягає у визначенні важливості лінгвістичного аспекту в передачі оперного образу і відмінностей, що спостерігаються при зміні мови лібрето, зокрема при порівнянні лібрето, написаних на двох романських мовах, французькою та італійською, на прикладі одного образу, але в двох редакціях лібрето: Образу Еврідіки з опери К.В. Глюка «Орфей та Еврідіка» у Віденській редакції (італійською мовою) і Паризькій редакції (французькою мовою). Методологія статті зумовлена з’єднанням музично-текстологічного та компаративного лінгвістичного підходів, завданнями семантичного интерпретативного аналізу, передбачає розвиток інтердисциплінарного напрямку музикознавства. Образ Еврідіки у двох редакціях буде порівнюватися за допомогою аналізу лібрето, постановок, а також за допомогою статистичного аналізу методом Max Reinert за кількістю оккуренцій, тобто повторів одного слова, синоніма або виразу, їх валентності і відсотка HAPAX- тобто тих слів, які одного разу зустрічаються в тексті і дають інформацію про граматичні функції, вказують на багатство мови. Наукова новизна даного дослідження полягає в новому підході до аналізу оперного образу, заснованому на компаративно-лінгвістичному аналізі тексту оперного твору. У даній роботі використовується принципово новий статистичний метод аналізу даних за допомогою системи Max Reinert в програмі IRaMuTeQ. Висновки. Вивчення лібрето опери «Орфей та Еврідіка» К. В Глюка з контрольованими параметрами епохи, стилю, композитора і музичного матеріалу, підкріплене статистичним аналізом, дозволяє стверджувати, що словесна мова впливає на передачу оперного образу навіть у разі використання двох мов романської групи (французької та італійської), що відкриває нові перспективи у вивченні оперних лібрето за допомогою статистики та акцентує увагу на важливості слова як маркера національних рис у побудові оперного образу.
Стилі APA, Harvard, Vancouver, ISO та ін.
3

Akimova, Nataliia, Alina Akimova та Anastasiya Akimova. "Дослідження ґенези розуміння текстів інтернету в юнацькому віці залежно від рівня мисленнєво-мовленнєвого розвитку". PSYCHOLINGUISTICS 31, № 1 (3 березня 2022): 6–24. http://dx.doi.org/10.31470/2309-1797-2022-31-1-6-24.

Повний текст джерела
Анотація:
Мета. Представити результати вивчення специфіки розуміння текстів інтернету читачами юнацького віку; дослідити особливості ґенези розуміння текстів інтернету залежно від рівня мисленнєво-мовленнєвого розвитку, притаманного певному читачеві; виявити закономірності динаміки успішності розуміння зі зростанням рівня мисленнєво-мовленнєвого розвитку на кожному етапі процесу розуміння. Методи і методики. У дослідженні використані теоретичні (дедукція, індукція, аналіз, синтез, узагальнення, систематизація), емпіричні (експеримент, метод семантичних і прагматичних інтерпретацій, контент-аналіз; суб’єктивного шкалування) та статистичні методи (первинна статистика, кореляційний аналіз). Вибірка склала 122 особи чоловічої та жіночої статі. Вивчення специфіки розуміння проводилося за авторською методикою “Успішність розуміння текстів інтернету”, що представлена у статті. Рівень мисленнєво-мовленнєвого розвитку респондентів було визначено за допомогою низки стандартизованих тестів, зокрема тесту Еббінгауза, методики “Встановлення закономірностей” Б.Л. Покровського, КОТ (короткий орієнтовний відбірковий тест В.Н. Бузина, Е.Ф. Вандерліка, опитувальник діагностики інтелекту). Результати. У дослідженні було встановлено, що чим вищий рівень розвитку когнітивної сфери досліджуваних, тим активніше вони читають тексти інтернету та точніше можуть прогнозувати зміст тексту за малюнком, проте дещо гірше за назвою. Успішність інтерпретації також покращується зі зростанням рівня мисленнєво-мовленнєвого розвитку, незалежно від типу тексту інтернету. На етапі емоційної ідентифікації ґенеза розуміння текстів інтернету визначається рівнем мисленнєво-мовленнєвого розвитку лише щодо узгодженості емоційної оцінки, яка залежить від специфіки тексту інтернету. Висновки. Доведено, що рівень мисленнєво-мовленнєвого розвитку юнаків впливає на успішність їх розуміння текстів інтернету. Особливо відчутній цей вплив на етапах рецепції та інтерпретації. На етапі емоційної ідентифікації рівень мисленнєво-мовленнєвого розвитку впливає лише на узгодженість емоційної оцінки і лише щодо окремих типів текстів інтернету.
Стилі APA, Harvard, Vancouver, ISO та ін.
4

Khomytska, I. Yu, V. M. Teslyuk та V. V. Beregovskyi. "Математичні метод і модель диференціації фоностатистичних структур авторського стилю". Scientific Bulletin of UNFU 29, № 7 (26 вересня 2019): 155–59. http://dx.doi.org/10.15421/40290731.

Повний текст джерела
Анотація:
Розроблено метод комплексного аналізу диференціації фоностатистичних структур авторського стилю англійської мови, який ґрунтується на поєднанні трьох статистичних критеріїв: критерію Стьюдента, критерію Колмогорова-Смірнова і критерію хі-квадрат. Поєднання цих критеріїв дає змогу підвищити достовірність диференціації авторських стилів. Для розв'язання задачі диференціації авторських стилів побудовано статистичну модель, яка підвищує достовірність результатів авторської атрибуції тексту. Розроблена програмна система реалізує метод і модель з використанням мови програмування Java, що забезпечує платформонезалежність. Для тестування програми вибрано статті С. Логан і Д. Вебстер з газети "Вільна газета" ("Freedom Paper", papers by S. Logan and D. Webster). Істотні відмінності встановлено за групами носових, дорсальних і велярних фонем за критерієм Стьюдента, за всіма вісьмома групами фонем за критерієм Колмогорова-Смірнова, істотні відмінності встановлено за групами сонорних, щілинних, дорсальних, зімкнених, губних і носових фонем за критерієм хі-квадрат. Поєднання використаних критеріїв дало змогу встановити групу фонем з найбільшою авторорозрізняльною здатністю. Це група дорсальних фонем. За цією групою можна диференціювати тексти різних авторів, що дає змогу змінімізувати кількість груп фонем, за якими здійснюється авторська атрибуція тексту.
Стилі APA, Harvard, Vancouver, ISO та ін.
5

Величко, Владислав Євгенович. "Використання хмарних технологій при підготовці та публікації текстів математичного напряму". New computer technology 13 (25 грудня 2015): 323–27. http://dx.doi.org/10.55056/nocote.v13i0.922.

Повний текст джерела
Анотація:
Мета дослідження: аналіз використання хмарних технологій при підготовці та публікації текстів математичного напряму. Завдання дослідження: розглянути способи публікації текстів математичного напряму в комп’ютерних мережах. Об’єкт дослідження: хмарні технології навчання. Предмет дослідження: можливості хмарних технологій для створення та публікації текстів математичного напряму. Використані методи дослідження: аналіз статистичних даних та наукових публікацій. Результати дослідження. Електронне навчання неможливе без якісних освітніх ресурсів серед яких зустрічаються і тексти математичного напряму, створення та відображення яких має певну специфіку. Зважаючи на це слід розглянути існуючі можливості створення та публікації текстів математичного напряму. Наведені різноманітні методи публікації математичних текстів в комп’ютерних мережах, розглянуті їх переваги та недоліки. Охарактеризовані методи створення математичних текстів, виконано аналіз існуючих додатків хмарних технологій в напрямку створення та публікації текстів математичного напряму. Основні висновки. Створені таким чином тексти математичного напряму мають загальноприйнятий вигляд та доступні для обробки сервісами хмарних технологій.
Стилі APA, Harvard, Vancouver, ISO та ін.
6

Khomytska, I. Yu, V. M. Теslyuk та V. V. Beregovskyi. "Метод комплексного аналізу диференціації фоностатистичних структур стилів англійської мови". Scientific Bulletin of UNFU 29, № 6 (27 червня 2019): 140–43. http://dx.doi.org/10.15421/40290627.

Повний текст джерела
Анотація:
Розроблено метод комплексного аналізу диференціації фоностатистичних структур стилів англійської мови. Метод ґрунтується на поєднанні двох статистичних критеріїв перевірки гіпотези на однорідність вибірки: критерію Стьюдента і критерію Колмогорова-Смірнова. Поєднання даних критеріїв забезпечує підвищення ефективності диференціації стилів. На основі розробленого методу, побудовано статистичну модель визначення ступеня дії чинника авторської манери викладу. Модель дає змогу підвищити ефективність стильової та авторської атрибуцій тексту. Розроблені метод і модель програмно реалізовано мовою програмування Java. POST запити двох типiв: /process i /process/transcription. розроблено у програмi. За відсутності транскрипційного варіанта досліджуваного тексту, використовується перший запит, другий – за його наявності. Скоротити час роботи програми дає змогу другий запит. Вбудовану базу даних H2 написано мовою програмування Java. База даних H2 є відкритою, кросплатформною. Вона підтримує мову SQL, має добру інтеграцію із використовуваним фреймворком Spring Boot i не потребує додаткових інсталяцій. У структурі даних HashMap зберігається відповідь із сайту транскрипцiйного перекладу. Структура побудована на принципі ключ-значення i дає змогу уникати дублікатів. Якщо опрацьовується велика кількість даних, то зменшується кількість запитів у мережі Інтернет, що забезпечує незалежність і автономність програми. Малі затрати часу є характерними для роботи програми.
Стилі APA, Harvard, Vancouver, ISO та ін.
7

Рябоконь, Т., та А. Петрашенко. "Програмні засоби формування та обробки бази даних словосполучень української мови." COMPUTER-INTEGRATED TECHNOLOGIES: EDUCATION, SCIENCE, PRODUCTION, № 44 (2 листопада 2021): 141–48. http://dx.doi.org/10.36910/6775-2524-0560-2021-44-22.

Повний текст джерела
Анотація:
Дана стаття присвячена опису створення бази даних словосполучень та виявленню найбільш ефективних методів знаходження словосполучень у тексті. Проведено аналіз існуючих досліджень статистичних методів виділення колокацій з текстових даних та запропоновано критерій для порівняння їх ефективності в роботі з текстами саме українською мовою. Також описано архітектуру автоматизованої генерації бази даних словосполучень та можливі способи її прискорення. Проведено експеримент та визначено найбільш ефективний метод знаходження словосполучень для обраного корпусу текстів українською мовою.
Стилі APA, Harvard, Vancouver, ISO та ін.
8

Цапенко, Л. Ю., О. С. Попович та М. Г. Томенко. "МОРФОЛОГІЧНІ ОСОБЛИВОСТІ АТРИБУТІВ У ДВОКОМПОНЕНТНИХ КОНСТРУКЦІЯХ У ТЕКСТАХ ОФІЦІЙНО-ДІЛОВОГО ДИСКУРСУ ЯК СТИЛІСТИЧНИЙ МАРКЕР". Nova fìlologìâ, № 84 (30 грудня 2021): 255–61. http://dx.doi.org/10.26661/2414-1135-2021-84-36.

Повний текст джерела
Анотація:
У статті розглядаються атрибути, які є частиною двокомпонентних конструкцій, які функціонують у текстах офіційного-ділового дискурсу, з метою представлення типології словотворення (словотворення за допомогою суфіксів), реалізованої в таких атрибутах як можливий стилістичний маркер офіційного-ділового дискурсу. Текстові корпуси, що належать до жанрів офіційно-ділового дискурсу, були використані як матеріал для дослідження. Для повноти та достовірності опису було вирішено проаналізувати чотири різні жанри, що належать до офіційного дискурсу, – офіційну кореспонденцію (взята з листування Британської ради з викладачами університетів закордонних країн (Кореспонденція Британської ради), судові процесуальні документи (тексти судових документів Адміністративного трибуналу Міжнародної організації праці (МОП) у збірнику «Судді Адміністративного трибуналу Міжнародної організації праці»), тексти на основі інструкцій з технічного обслуговування транспортних засобів (тексти інструкцій з експлуатації автомобілів «Тойота»), формулу винаходів (патенти) (тексти, що містять формули винаходів у галузі фізики та радіоелектроніки, які витягнуті з ліцензованих джерел). Загальний розмір текстових корпусів – 200 тисяч слововживань, тексти кожного жанру включали вибірки 50 тисяч слововживань. Обов’язковим складником аналізу були статистичні дослідження, які демонструють частоту використання цього граматичного феномену в текстах. Вони також дозволяють наглядно представляти дані, які підтверджують гіпотези в початковому дослідженні або суперечать таким. Порівняльний аналіз між обома типами жанрів – «гуманітарними» та «технічними» – показує, що: по-перше, в обох типах жанрів є загальна закономірність, це стосується насамперед неафіксальних атрибутів, які в усіх без винятку жанрах мають найбільшу частоту використання, ніж атрибутів з афіксами; по-друге, серед найпоширеніших суфіксів, що використовуються в атрибутах, можна виділити загальні: -tion, -ty. Але на цьому загальна характеристика атрибутів суфікса закінчується. Тому за результатами проведеного статистичного аналізу можна зробити висновок, що з високим ступенем імовірності дериваційні одиниці атрибутів, виражені суфіксами, які включені у двокомпонентні конструкції в жанрах офіційно-ділового стилю, не можуть використовуватися як стилістичний маркер офіційно-ділового дискурсу.
Стилі APA, Harvard, Vancouver, ISO та ін.
9

Гаман, І. А., та Б. О. Лисюк. "ВЕРБАЛІЗАЦІЯ ІННОВАЦІЙНОГО РОЗВИТКУ В НІМЕЦЬКОМОВНИХ ВІДЕОПОВІДОМЛЕННЯХ САЙТІВ DEUTSCHE WELLE ТА YOUTUBE". Nova fìlologìâ, № 82 (10 серпня 2021): 31–37. http://dx.doi.org/10.26661/2414-1135-2021-82-5.

Повний текст джерела
Анотація:
Стаття присвячена аналізу особливостей вербалізації інноваційних процесів, висвітлених у німецькомовних відеоповідомленнях, які характеризуються передачею інформації через поєднання вербального та невербального компонентів. Усі досліджені та проаналізовані відеоматеріали були опубліковані на сайтах Deutsche Welle та YouTube у період з 2015 по 2021 рр. Кількість німецькомовних відеоматеріалів інноваційного «спрямування» постійно збільшується у зв’язку з безперервним технологічним прогресом суспільства. Нині сучасні медіа відіграють головну роль у відображенні дійсності, вирізняються мовною неоднорідністю та строкатістю. Використання лексики різного ступеня фаховості сприяє формуванню певних уявлень та ідей, які транслюються реципієнтові у відеоповідомленнях. Медіатекст – це багаторівневий текст, який поєднує в собі різні семіотичні коди (зображення та слово). Відеоповідомлення є прикладом медіатексту, за допомогою якого суспільство інтегрується у світовий простір та який сприяє ефективній міжкультурній взаємодії. У статті розглядаються полікодовий текст та відеоповідомлення як приклад полікодового тексту. Передусім увага приділяється особливостям вербалізації інноваційних процесів у німецькомовних відеоматеріалах. Досліджені відеоповідомлення, в яких висвітлено тематику інноваційного розвитку, відрізняються своїм смисловим наповненням, однак проаналізований лексичний склад дає змогу зробити висновки про шляхи актуалізації засобів для відображення інноваційного процесу. Під час аналізу були враховані також прагматичні інтенції авторів медіатекстів та розробників інновацій, які полягають не лише на тому, щоб повідомити про нововведення, але й спонукати реципієнта до певних роздумів та дій. Для проведення дослідження використано описовий, статистичний, гіпотетико-дедуктивний, індуктивний методи. За допомогою описового методу проведено роботу з теоретичним матеріалом. Гіпотетико-дедуктивний метод слугував для зібрання фактичного матеріалу дослідження, індуктивний метод – для лінгвістичного аналізу. Розвідка має міждисциплінарний характер і сприяє формуванню уявлення про роль інновацій, обсяги інвестицій і пріоритетність напрямів досліджень.
Стилі APA, Harvard, Vancouver, ISO та ін.
10

Карпіна, Олена. "КОМПАРАТИВНИЙ АНАЛІЗ ЛІТЕРАТУРНОГО Й МАШИННОГО ПЕРЕКЛАДІВ (НА МАТЕРІАЛІ ФРАГМЕНТІВ РОМАНУ С. ПЛАТ “THE BELL JAR”)". Актуальні питання іноземної філології, № 12 (22 червня 2021): 94–101. http://dx.doi.org/10.32782/2410-0927-2020-12-16.

Повний текст джерела
Анотація:
У статті запропоновано порівняльний аналіз перекладу фрагментів художнього тексту, здійсненого системами автоматизованого онлайн-перекладу MateCat і Pragma 6 On-Line. Висвітлено зміст понять адекватного та еквівалентного перекладу, що стало відправною точкою оцінки якості машинного перекладу. Обґрунтовано вибір програм машинного перекладу, що віддзеркалюють дві глобальні стратегії їх моделювання, а саме: системи машинного перекладу на основі лінгвістичних правил та статистичні системи. Схарактеризовано перекладацькі трансформації, до яких удається авторка літературного перекладу Ольга Любарська, що слугували еталоном якості, який повною мірою відповідає критеріям еквівалентного/адекватного перекладу: точно відтворює зміст та відбиває комунікативні установки авторки твору. Окреслено низку вдалих перекладацьких рішень, якими відзначено окремі фрагменти машинного перекладу. Детальному розгляду піддано помилки та перекладацькі огріхи, що припускають програми автоматизованого онлайн-перекладу. Виявлені помилки було згруповано відповідно до лінгвістичних рівнів, що сприяло утворенню лексичних, морфологічних та синтаксичних типів помилок. До лексичних помилок належить вживання слів у невластивому для них значенні, яке не відповідає їхнім контекстуальним умовам; наявність неперекладених слів та словосполучень; дослівний переклад, уживання росіянізмів; неспроможність коректної інтерпретації фразеологічних зворотів; неправильний переклад через помилки у вихідному тексті тощо. До морфологічних помилок відійшли некоректне визначення частиномовної належності лексем у випадках граматичної омонімії, порушення граматичних категорій, зокрема категорії часу дієслів, помилки при творенні відмінкових закінчень іменників і прикметників. До синтаксичних помилок віднесено порушення смислових зв’язків під час побудови словосполучень та речень, а саме узгодження між членами речення, некоректне вживання сполучників у межах синтаксичних конструкцій, порушення порядку слів у реченнях.
Стилі APA, Harvard, Vancouver, ISO та ін.

Дисертації з теми "Статистичний аналіз тексту"

1

Подшиваленко, Б. О. "Застосування методів статистичного аналізу для розв’язання задачі ідентифікації текстів". Thesis, ХНУРЕ, 2021. https://openarchive.nure.ua/handle/document/16437.

Повний текст джерела
Анотація:
The aim of this work is research of mathematical methods of identifying the author of the text. Using the method of analysis of hierarchies, the optimal method for solving the problem is chosen according to certain criteria – the me-thod of statistical analysis. The possibility of applying the selected methods to the identification of text of Ukrainian literature is investigated. A software application has been developed, thanks to which it is possible to determine the probability that the text belongs to one or another author from those analyzed.
Стилі APA, Harvard, Vancouver, ISO та ін.
2

Бондарєв, О. В. "Інтелектуальна система керуванням інформаційно-навчальним web-порталом". Master's thesis, Сумський державний університет, 2019. http://essuir.sumdu.edu.ua/handle/123456789/76754.

Повний текст джерела
Анотація:
Розроблено вхідний математичний опис включаючи словник ознак та алгоритмів оптимізації параметрів навчання інтелектуального порталу, послідовно та логічно описано схему алгоритму навчання та екзамену порталу знань. Розроблено математична модель навчання порталу знань. Алгоритм реалізовано на мові програмування C#.
Стилі APA, Harvard, Vancouver, ISO та ін.
Ми пропонуємо знижки на всі преміум-плани для авторів, чиї праці увійшли до тематичних добірок літератури. Зв'яжіться з нами, щоб отримати унікальний промокод!

До бібліографії