Добірка наукової літератури з теми "N-грама"

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "N-грама".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Статті в журналах з теми "N-грама"

1

Ельцова, M. Eltsova, Гашков, and Alexander Gashkov. "Indistinct Comparison of Texts by Modified Method of q-grams." Modern Communication Studies 3, no. 1 (February 10, 2014): 47–49. http://dx.doi.org/10.12737/2451.

Повний текст джерела
Анотація:
The paper is devoted to indistinct comparison of texts by means of q-grams and Bloom’s-filter on a material of official, art and scientific texts in Russian. The suggested method allows assess texts’ similarity approximately.
Стилі APA, Harvard, Vancouver, ISO та ін.
2

Manzhikov, Temujin V., Oleg A. Slavin, Igor A. Faradzhev, and Igor M. Janiszewski. "N-Grams Algorithm Application for the Correction of Recognition Results." Vestnik RFFI, no. 4(92) (2016): 116–23. http://dx.doi.org/10.22204/2410-4639-2016-092-04-116-123.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
3

Baranov, V. A. "Experience of Creation of the N-Gram Module of the System “Manuscript” and Evaluation of The Efficiency of Its Application to Search Collocations in the Corpus of M.V. Lomonosov." Intellekt. Sist. Proizv. 14, no. 4 (January 30, 2017): 124. http://dx.doi.org/10.22213/2410-9304-2016-4-124-131.

Повний текст джерела
Анотація:
В статье описаны функции и параметры модуля n-грамм информационно-аналитической системы (корпуса) «Манускрипт» и итоги эксперимента по применению нескольких статистических методов в корпусе текстов М. В. Ломоносова. Показано, что количественные и статистические методы оценки биграмм применимы к авторскому историческому корпусу и позволяют выявлять устойчивые сочетания.
Стилі APA, Harvard, Vancouver, ISO та ін.
4

Baranov, V. A., and R. A. Vernyaeva. "Corpus of M. V. Lomonosov in the Internet: New Opportunities." Intellekt. Sist. Proizv. 14, no. 4 (January 30, 2017): 132. http://dx.doi.org/10.22213/2410-9304-2016-4-132-136.

Повний текст джерела
Анотація:
В статье представлен обзор новых возможностей корпуса текстов Ломоносова (lomonosov.pro). Усовершенствования коснулись аналитической и лингвистической разметок текстов, параметров запроса и форм демонстрации выборок. Особое внимание уделено результатам работ по созданию указателей личных и географических имен, словаря лингвистических терминов, третьей версии модулей n-грамм и статистики и некоторых других средств доступа к данным.
Стилі APA, Harvard, Vancouver, ISO та ін.
5

ПОЖАРИЦЬКА, Олена Олександрівна, та Кирило Володимирович ТРОЇЦЬКИЙ. "ВИКОРИСТАННЯ ЦИФРОВИХ ТЕХНОЛОГІЙ ДЛЯ ВИПРАВЛЕННЯ ГРАМАТИЧНИХ ПОМИЛОК: СИНТАКСИЧНІ N-ГРАМИ ТА МЕТОДИ ГЛИБИННОГО НАВЧАННЯ". Мова, № 35 (29 липня 2021): 237–41. http://dx.doi.org/10.18524/2307-4558.2021.35.237789.

Повний текст джерела
Анотація:
Об’єкт статті — автоматизоване виправлення граматичних помилок як галузь лінгвістики. Предмет статті — різноманітність методів та технологій, які використовуються у виправленні граматичних помилок, а також можливості їх використання та оцінка. У статті розглянуто найбільш продуктивні методи, що застосовуються у галузі виявлення та виправлення граматичних помилок в комп’ютерній лінгвістиці. Мета статті полягає у маніфестації ефективності застосування комп’ютерних програм задля виявлення граматичних помилок в англомовному тексті. Дослідницькі методи, використані у статті: аналіз данних, опис абстрактних комп’ютерних моделей та спостереження над їх продуктивністю. У статті розглянуто комп’ютерну модель для виявлення та визначення граматичних помилок, засновану на синтаксичних n-грамах, дано її визначення, описано шляхи її реалізації та етапи попередньої обробки даних, необхідні для роботи моделі. Встановлено, що конкретними типами помилок, які залучена комп’ютерна модель може виявити, є помилки підмето-присудкового узгодження, помилки у виборі прийменника, числа іменників, а також деякі типи помилок, пов’язані з використанням артиклю. Також у статті проаналізовано іншу модель, засновану на архітектурі трансформера — GECToR (Grammatical Error Correction: Tag, Not Rewrite). Ця модель глибинного навчання спрямована на виявлення та виправлення набагато складніших помилок, у тому числі тих, що пов’язані з екстралінгвістичними реаліями. Крім того, вона є доволі корисною, оскільки, на відміну від інших моделей, які просто коригують неправильні слова без пояснень, GECToR призначає теги, які можна додатково інтерпретувати для навчальних цілей. У процесі аналізу зроблено висновок про переваги та недоліки розглянутих моделей та методів, що були виявлені після їх практичної реалізації. Під час оцінки продуктивності вищезазначених моделей на основі спільного завдання BEA 2019 були отримані наступні результати: модель, заснована на синтаксичних n-грамах, отримала показник F0,5 7,6 %, а оцінка F0,5 моделі GECToR визначила її ефективність як 66,7 %. Отримані дані свідчать про майже дев’ятикратну перевагу ефективності методів глибинного навчання (типу GECToR) порівняно з методами, заснованими на правилах (типу методу синтаксичних n-грамів).
Стилі APA, Harvard, Vancouver, ISO та ін.
6

Савченко, Д. С. "Перцептивна модифікація метода N-грам для оцінювання схожості послідовностей символів за коефіцієнтом Серенсена". Телекомунікаційні та інформаційні технології, № 2 (2016): 85–92.

Знайти повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
7

Баранов, Виктор А. "К вопросу об использовании статистических методов для поиска коллокаций и коллигаций в древнейших славянских текстах (на материале глаголических рукописей корпуса »Манускрипт«)". Slovo, № 69 (2019): 1–33. http://dx.doi.org/10.31745/s.69.1.

Повний текст джерела
Анотація:
Работа посвящена вопросам методики поиска цельных сочетаний в коллекции глаголических текстов исторического корпуса Манускрипт: славянское письменное наследие (manuscripts.ru) и оценки их устойчивости. Демонстрируются возможности модуля n-грамм, позволяющие извлекать сочетания, имеющие разное количество компонентов, различную частотность, состоящие из текстовых форм или из лемм. Анализируются биграммы и триграммы, извлеченные с помощью статистической меры Mutual Information и встречающиеся одновременно в нескольких рукописях коллекции. Особое внимание обращается на n-граммы, имеющие высокие статистические значения меры. В соответствии с особенностями меры наибольшие значения имеют редкие в коллекции сочетания. Анализ таких биграмм на основе словоформ позволил выявить устойчивые грамматические конструкции – коллигации. Показывается, что триграммы, состоящие из текстовых форм, являются не только грамматически, но и семантически цельными – коллокациями. Разнообразны биграммы с компонентами-леммами – предложно-падежные сочетания, именные сочетания с зависимыми притяжательными местоимениями и иные атрибутивные конструкции, глагольные конструкции с зависимыми существительными и другиe. Анализ этих групп позволил выявить как коллигации, так и коллокации. Наиболее результативным стало извлечение триграмм на основе лемм – подавляющая часть первых нескольких десятков сочетаний, имеющих максимальное значение в соответствии со статистической мерой MI, представляет собой грамматически и семантически цельные конструкции или их части. Делается вывод об эффективности использования статистических методов для извлечения коллокаций и коллигаций из корпусов, содержащих средневековые славянские рукописи. Указывается, что для комплексного решения поставленной задачи должны быть использованы различные виды n-грамм – двукомпонентные и трехкомпонентные, на основе текстовых форм и лемм, со свободным и фиксированным порядком следования компонентов. Наличие повторяющихся в различных рукописях грамматически и семантически цельных сочетаний позволяет сделать вывод о надтекстовой природе таких сочетаний.
Стилі APA, Harvard, Vancouver, ISO та ін.
8

Камловский, Олег Витальевич, та Oleg Vital'evich Kamlovskii. "Метод тригонометрических сумм для исследования частот $r$-грамм в старших координатных последовательностях линейных рекуррент над кольцом $\mathbb{Z}_{2^n}$". Matematicheskie Voprosy Kriptografii [Mathematical Aspects of Cryptography] 1, № 4 (2010): 33–62. http://dx.doi.org/10.4213/mvk20.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
9

Константинова, Е. А., М. П. Кушников, В. Б. Зайцев, В. Г. Кытин, А. В. Марикуц, Г. В. Трусов, А. С. Седегов та П. К. Кашкаров. "Наноматериалы на основе диоксида титана с высокой фотокаталитической активностью". Российские нанотехнологии 14, № 5-6 (7 грудня 2019): 3–10. http://dx.doi.org/10.21517/1992-7223-2019-5-6-3-10.

Повний текст джерела
Анотація:
Методами рентгеновской дифракции, оптической спектроскопии и электронного парамагнитного резонанса (ЭПР) изучены микросферы и наногетероструктуры на основе диоксида титана, синтезированные методами пиролиза аэрозолей и золь-гель. Все исследуемые образцы характеризуются большой удельной площадью поверхности (около 100 квадратных метров на грамм вещества). Установлено, что основным типом радикалов в полученных структурах являются N•, NO•, а также центры Ti3+, Mo5+, V4+ и W5+. Микросферы и наногетероструктуры, состоящие из нескольких оксидов металлов, обладают высокой фотокаталитической активностью в видимом диапазоне спектра и способностью аккумулировать фотогенерированные носители заряда. Как следствие, каталитические реакции в образцах продолжаются и после выключения освещения. Обнаружена корреляция между скоростью фотокатализа и концентрацией радикалов в исследуемых структурах. Полученные результаты могут быть использованы для разработки энергоэффективных каталитических устройств нового поколения на основе нанокристаллического оксида титана, функционирующих в видимом диапазоне спектра и не требующих непрерывного освещения.
Стилі APA, Harvard, Vancouver, ISO та ін.
10

BATIUK, TARAS, та VICTORIA VYSOTSKA. "СИСТЕМА ПІДТРИМКИ ПРИЙНЯТТЯ РІШЕНЬ ДЛЯ ПІДТРИМКИ КОРИСТУВАЧІВ СОЦІАЛЬНИХ МЕРЕЖ НА ОСНОВІ ПОДІБНИХ СПІЛЬНИХ ІНТЕРЕСІВ ТА ВПОДОБАНЬ". Computer systems and information technologies, № 1 (14 квітня 2022): 11–22. http://dx.doi.org/10.31891/csit-2022-1-2.

Повний текст джерела
Анотація:
На сьогодення соціалізація особистостей за спільними інтересами є надзвичайно важливим процесом під час ізоляції людей із-за подовженості світової пандемії. Паралельно більшість людей завжди намагаються спростити та автоматизувати всі основні життєві процеси, які зазвичай займають багато вільного часу. Це ж стосується і процесу соціалізації особистості. Машинне навчання та SEO-технології на даний момент є надзвичайно важливими в контексті розроблення ІС опрацювання та аналізу великих даних . Практично кожна популярна серед великої кількості людей ІС використовує відповідні механізми соціалізації. Головною функцією ІС соціалізації особистостей за спільними інтересами є пошук релевантних користувачів, тому основним завданням є написати оптимізований алгоритм, який максимально автоматизує процес соціалізації користувачів. В даному випадку створений спеціальний алгоритм на основі таких алгоритмів, як алгоритм Левенштейна, розширення вибірки, N-грам та моделі Noisy Channel. До наукової новизни одержаних результатів варто віднести розроблення нового алгоритму аналізу користувацької інформації та пошуку найбільш релевантних користувачів ІС відповідно до проаналізованого тексту повідомлень профілю на основі вже існуючих алгоритмів Левенштейна, розширення вибірки, N-грам та моделі Noisy Channel. Для створення динамічної ІС соціалізації використано шаблон асинхронного програмування. Удосконалено згорткову нейронну мережу, що дозволило ефективно здійснювати пошук людських обличь на фото та перевіряти наявність вже існуючих людей в БД ІС. Система дозволить ефективно та швидко здійснювати підбір, аналіз, опрацювання текстових даних та формування кінцевого результату. В системі використовуються SEO-технології для ефективного та якісного інтелектуального пошуку та опрацювання відповідних даних за потребою конкретного користувача. Нейронна мережа дозволяє ефективно здійснювати ідентифікацію користувача по його фото. Загалом використовувані алгоритми дозволяють створити зручну ІС соціалізації з використанням необхідних для цього алгоритмів. Варто зазначити важливість оптимізації наявної в ІС, в першу чергу це повна асинхронність системи, що дозволить уникнути всіх довгих очікувань та важких в плані опрацювання та аналізу запитів, система дозволяє ефективно та динамічно працювати з різними обсягами великих даних, здійснювати їх аналіз, опрацювання та формування нових даних необхідних користувачам ІС. Також використовується хмарний сервіс, який дозволить здійснити розподіл даних, відповідно можна буде зберігати всі найбільш важкі дані в хмарному середовищі і з використанням простого програмного інтерфейсу ІС за допомогою запитів здійснювати завантаження всіх необхідних даних. Таким чином, можна стверджувати, що створення даної ІС є важливим як і в соціальному плані, так і в плані реалізації всіх алгоритмів, які забезпечують необхідний функціонал ІС.
Стилі APA, Harvard, Vancouver, ISO та ін.

Дисертації з теми "N-грама"

1

Подшиваленко, Б. О. "Застосування методів статистичного аналізу для розв’язання задачі ідентифікації текстів". Thesis, ХНУРЕ, 2021. https://openarchive.nure.ua/handle/document/16437.

Повний текст джерела
Анотація:
The aim of this work is research of mathematical methods of identifying the author of the text. Using the method of analysis of hierarchies, the optimal method for solving the problem is chosen according to certain criteria – the me-thod of statistical analysis. The possibility of applying the selected methods to the identification of text of Ukrainian literature is investigated. A software application has been developed, thanks to which it is possible to determine the probability that the text belongs to one or another author from those analyzed.
Стилі APA, Harvard, Vancouver, ISO та ін.
2

Тонкошкур, С. В. "Інформаційна технологія проектування онлайн-платформи неформальної освіти". Master's thesis, Сумський державний університет, 2018. http://essuir.sumdu.edu.ua/handle/123456789/72082.

Повний текст джерела
Анотація:
На основі алгоритму N-грам було розроблено власний алгоритм пошуку, виконано його програмну реалізацію та інтегровано у онлайн-платформу неформальної освіти, за рахунок чого покращено релевантість результатів пошуку. Також реалізовано інструменти адміністрування освітніх заходів, які спрощують і пришвидшують процес адміністрування освітніх заходів.
Стилі APA, Harvard, Vancouver, ISO та ін.
Ми пропонуємо знижки на всі преміум-плани для авторів, чиї праці увійшли до тематичних добірок літератури. Зв'яжіться з нами, щоб отримати унікальний промокод!

До бібліографії