Номер части: |
|||||||||||||
Журнал |
ISSN: 2411-6467 (Print)
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
O НАХОЖДЕНИИ НЕСХОДСТВА МЕЖДУ ТЕМАТИКАМИ СТАТЕЙ (22-25)
Науки и перечень статей вошедших в журнал:
DOI:
Дата публикации статьи в журнале: 2020/06/14
Название журнала: Евразийский Союз Ученых, Выпуск: 74, Том: 4, Страницы в выпуске: 22-25
Автор: Решетников Александр Дмитриевич
Россия, г. Воронеж , ФГБОУ ВО «Воронежский государственный университет», Аспирант кафедры Вычислительной Математики и Прикладных Информационных Технологий
Россия, г. Воронеж , ФГБОУ ВО «Воронежский государственный университет», Аспирант кафедры Вычислительной Математики и Прикладных Информационных Технологий
Автор: Леденева Татьяна Михайловна
Россия, г. Воронеж , ФГБОУ ВО «Воронежский государственный университет», Профессор, доктор технических наук, заведующая кафедрой Вычислительной Математики и Прикладных Информационных Технологий факультета Прикладной Математики, Информатики и Механики
Россия, г. Воронеж , ФГБОУ ВО «Воронежский государственный университет», Профессор, доктор технических наук, заведующая кафедрой Вычислительной Математики и Прикладных Информационных Технологий факультета Прикладной Математики, Информатики и Механики
Анотация: Данная работа посвящена проблеме поиска статей по интересующей пользователя тематике. Основной проблемой можно назвать тот факт, что существуют разные виды алгоритмов, некоторое из которых учитываю семантическую нагрузку текста, а некоторые предназначены для синтаксического анализа. При подборе схожих публикаций, исследователя интересует семантическое подобие. В предложенном подходе мы остановимся на обработке ключевых слов, поскольку авторы этих статьи стараются вынести в эту секцию термины, отражающие идею своей публикации. Подготовив словари для целевых тематик и проведя предварительную обработку текстов, можно получить меру сходства/несходства между двумя статьями. Используя полученную оценку, можно набрать выборку, основанную на близости к оригинальной работе. Результаты данного подхода продемонстрированы на модельном примере.
Ключевые слова:
мера несходства
косинусное сходство
публикации
Данные для цитирования: Решетников Александр Дмитриевич Леденева Татьяна Михайловна . O НАХОЖДЕНИИ НЕСХОДСТВА МЕЖДУ ТЕМАТИКАМИ СТАТЕЙ (22-25) // Евразийский Союз Ученых. Технические науки. 2020/06/14; 74(4):22-25.
Список литературы: 1. Решетников А.Д. О подходах для определения меры несходства в текстовых данных / А.Д. Решетников // Вестник Воронежского Института Высоких Технологий. – 2019. – №3. – С.35–38 [Reshetnikov A. D. About approaches to determining the measure of dissimilarity in text data //
The Bulletin of the Voronezh Institute of High
Technologies. – 2019. – №3. – p.35–38 (in Russ.)]
2. Billard, L Symbolic data analysis / L. Billard,
E. Diday. – 1st ed. – Wiley, 2006. – 330 p.
3. Deza M. Encyclopedia of Distances / M. Deza, E. Deza. – 3rd ed. – Springer, 2014. – 733p.