Номер части:
|
|||||||||||||
Журнал
|
ISSN: 2411-6467 (Print)
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
СРАВНЕНИЕ АЛГОРИТМОВ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРИ ОПРЕДЕЛЕНИИ ТЕМАТИК ПОСТОВ ЛЮДЕЙ В СОЦИАЛЬНОЙ СЕТИ “ВКОНТАКТЕ” (45-49)
Науки и перечень статей вошедших в журнал:
DOI:
Дата публикации статьи в журнале: 2020/07/21
Название журнала: Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале, Выпуск:
75, Том: 2,
Страницы в выпуске: 45-49
Автор:
Черкасов Егор Игоревич
магистрант, Институт информационных технологий, Челябинский Государственный Университет, Челябинск
магистрант, Институт информационных технологий, Челябинский Государственный Университет, Челябинск
Анотация: В статье исследуется определение тематик текстов постов людей в социальной сети “Вконтакте”. Дано описание тематического моделирования, описаны базовые модели векторного представления слов. Проведено сравнение моделей LDA, PLSA, ARTM при определении тематик текстов постов. Проведенные эксперименты показали, что лучше всего с этой задачей справляется модель ARTM.
Ключевые слова:
тематическое моделирование,
социальная сеть ,
Данные для цитирования: Черкасов Егор Игоревич . СРАВНЕНИЕ АЛГОРИТМОВ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРИ ОПРЕДЕЛЕНИИ ТЕМАТИК ПОСТОВ ЛЮДЕЙ В СОЦИАЛЬНОЙ СЕТИ “ВКОНТАКТЕ” (45-49) // Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале.
Технические науки.
2020/07/21;
75(2):45-49.
Список литературы: 1.Indexing by latent semantic analysis. / Scott Deerwester, Susan T. Dumais, George W. Furnas et al. // Journal of the American Society for Information Science 41. — 1990. — Pp. 391–407
2.Lund Kevin, Burgess Curt. Producing HighDimensional Semantic Spaces from Lexical CoOccurrence // Behavior Research Methods, Instruments, & Computers. — 1996. — Vol. 28. — Pp. 203–208.
3.Turney Peter D., Pantel Patrick. From Frequency to Meaning: Vector Space Models of Semantics // Journal of Artificial Intelligence Research, (2010), 37, 141-188. — 2010.
4.Distributed Representations of Words and Phrases and their Compositionality. / Tomas Mikolov, Ilya Sutskever, Kai Chen et al. // NIPS / Ed. by Christopher J. C. Burges, L´eon Bottou, Zoubin Ghahramani, Kilian Q. Weinberger. — 2013. — Pp. 3111–3119.
5.Bert: Pre-training of deep bidirectional transformers for language understanding / J. Devlin, M.-W. Chang, K. Lee, K. Toutanova // arXiv preprint arXiv:1810.04805. — 2018.
6.Deep contextualized word representations / M. E. Peters, M. Neumann, M. Iyyer et al. // arXiv preprint arXiv:1802.05365. — 2018
7.Efficient estimation of word representations in vector space / T. Mikolov, K. Chen, G. Corrado, J. Dean // arXiv preprint arXiv:1301.3781. — 2013.
8.Distributed representations of words and phrases and their compositionality / T. Mikolov, I. Sutskever, K. Chen et al. // Advances in neural information processing systems. — 2013. — Pp. 3111–3119.
9.Hofmann Thomas. Probabilistic Latent Semantic Analysis // Proceedings of the Fifteenth Conference on Uncertainty in Artificial Intelligence. — UAI’99. — San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 1999. — Pp. 289–296.
10.Blei David M., Ng Andrew Y., Jordan Michael I. Latent dirichlet allocation // Journal of Machine Learning Research. — 2003. — Vol. 3. — Pp. 993– 1022.
11.Воронцов К. В. Аддитивная регуляризация тематических моделей коллекций текстовых документов // Доклады РАН. — 2014. — Т. 456, № 3. — С. 268–271.