Номер части:
|
|||||||||||||
Журнал
|
ISSN: 2411-6467 (Print)
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND
РЕШЕНИЕ ЗАДАЧИ РАСПОЗНАВАНИЯ СИМВОЛОВ НА ИЗОБРАЖЕНИЯХ ТОВАРНЫХ ЦЕННИКОВ (63-65)
Науки и перечень статей вошедших в журнал:
DOI:
Дата публикации статьи в журнале: 2020/06/14
Название журнала: Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале, Выпуск:
74, Том: 3,
Страницы в выпуске: 63-65
Автор:
Марков Виталий Владиславович
студент, Челябинский государственный университет, Россия, г.Челябинск
студент, Челябинский государственный университет, Россия, г.Челябинск
Анотация: В работе сравниваются модель STAR-net и технология tesseract-ocr. Датасет представляет собой вырезанные слова с магазинных ценников, размеченных в автоматическом режиме с помощью сервиса Yandex OCR. Использовались такие метрики как доля правильных ответов и расстояние левенштейна. Наилучший результат показала модель STAR-net. Была проведена аналитика ошибок и даны рекомендации по улучшению качества.
Ключевые слова:
OCR,
задача распознавания символов,tesseract-ocr,STAR-net,расстояние левенштейна,
Данные для цитирования: Марков Виталий Владиславович . РЕШЕНИЕ ЗАДАЧИ РАСПОЗНАВАНИЯ СИМВОЛОВ НА ИЗОБРАЖЕНИЯХ ТОВАРНЫХ ЦЕННИКОВ (63-65) // Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале.
Технические науки.
2020/06/14;
74(3):63-65.
Список литературы: 1.Baek, Jeonghun, et al. “What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis.” 2019 IEEE/CVF International Conference on Computer Vision (ICCV), 2019, doi:10.1109/iccv.2019.00481.
2.Graves, Alex, et al. “Connectionist Temporal Classification.” Proceedings of the 23rd International Conference on Machine Learning - ICML '06, 2006, doi:10.1145/1143844.1143891.
3.He, Kaiming, et al. “Deep Residual Learning for Image Recognition.” 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, doi:10.1109/cvpr.2016.90.
4.Liu, Wei, et al. “STAR-Net: A SpaTial Attention Residue Network for Scene Text Recognition.” Procedings of the British Machine Vision Conference 2016, 2016, doi:10.5244/c.30.43.
5.Liu, Xuebo, et al. “FOTS: Fast Oriented Text Spotting with a Unified Network.” 2018 IEEE/CVF Conference on Computer Vision and Pattern
Recognition, 2018, doi:10.1109/cvpr.2018.00595.
6.Stanford cs class cs231n: Convolutional neural networks for visual recognition. http://cs231n.github.io/neural-networks-case-study/.
7.Tesseract OCR, https://tesseract-
ocr.github.io/tessdoc/
8.Karatzas, Dimosthenis, et al. “ICDAR 2013 Robust Reading Competition.” 2013 12th International Conference on Document Analysis and Recognition, 2013, doi:10.1109/icdar.2013.221.
9.Karatzas, Dimosthenis, et al. “ICDAR 2015
Competition on Robust Reading.” 2015 13th International Conference on Document Analysis and Recognition (ICDAR), 2015, doi:10.1109/icdar.2015.7333942.
10. Wang, Kai, et al. “End-to-End Scene Text
Recognition.” 2011 International Conference on Computer Vision, 2011, doi:10.1109/iccv.2011.6126402.