В период быстрого развития информационных технологий, когда объемы передаваемой информации измеряется в гигабайтах и даже терабайтах, разработка высокоэффективных алгоритмов и методов сжатия видеоинформации остается актуальным.
На сегодняшний день из существующих кодеков наиболее большее распространение получили кодеки на основе модифицированного дискретно косинусного преобразования (МДКП) и кодеки на основе вейвлет преобразования. Последние дают лучшее качество восстановленных изображений при больших коэффициентах сжатия сравнительно МДКП. Одним из таких кодеков является Дирак.
Существует несколько типов вейвлет функции, которые в зависимости от сюжета кадра дают разные показатели качества и коэффициента сжатия. Коэффициент сжатия зависит от размеров кадра, и уменьшение исходного размера (масштабирование) кадра увеличит коэффициент сжатия.
Дирак это кодек, разработанный английской компаний BBC, позволяющий сжимать последовательность изображений на основе заранее выбранных пользователем параметров. Он является программой с открытым кодом, созданный в исследовательских целях [1]. Для исследования, используя библиотеки Dirac.
Таблица 1.
Коэффициенты сжатия, полученные при сжатии вейвлет функциями
Deslauriers—Dubuc(9,7) | |||||||||||||||||
Качество
Изображение |
3 | 7 | 10 | ||||||||||||||
с (раз) |
без (раз) |
К (раз) |
с (раз) |
без (раз) |
К (раз) |
с (раз) |
без (раз) |
К (раз) |
|||||||||
Apple | 334,6 | 118,0 | 2,8 | 76,0 | 22,8 | 3,3 | 23,6 | 7,1 | 3,3 | ||||||||
Music | 202,1 | 72,0 | 2,8 | 53,7 | 19,6 | 2,7 | 21,8 | 7,1 | 3,1 | ||||||||
Rio2016 | 435,7 | 189,4 | 2,3 | 150,8 | 71,5 | 2,1 | 81,2 | 37,3 | 2,2 | ||||||||
Wall e | 366,5 | 122,7 | 3,0 | 90,9 | 31,1 | 2,9 | 38,1 | 12,7 | 3,0 | ||||||||
Legal (5,3) | |||||||||||||||||
Apple | 337 | 115 | 2,9 | 76,1 | 22 | 3,5 | 24 | 7,4 | 3,2 | ||||||||
Music | 205 | 68,9 | 3,0 | 51,2 | 18 | 2,9 | 21 | 6,9 | 3,1 | ||||||||
Rio2016 | 431 | 186 | 2,3 | 152 | 67 | 2,3 | 79 | 33 | 2,4 | ||||||||
Wall e | 349 | 120 | 2,9 | 89,9 | 29 | 3,1 | 36 | 12 | 3,0 | ||||||||
Deslaurers—Dubuc(13,7) | |||||||||||||||||
Apple | 321 | 111 | 2,9 | 75,2 | 21 | 3,6 | 23 | 7,1 | 3,3 | ||||||||
Music | 199 | 70 | 2,8 | 51,3 | 18 | 2,9 | 21 | 6,9 | 3,0 | ||||||||
Rio2016 | 414 | 177 | 2,3 | 146 | 65 | 2,2 | 73 | 32 | 2,3 | ||||||||
Wall e | 343 | 114 | 3,0 | 86,6 | 28 | 3,1 | 34 | 12 | 3,0 | ||||||||
Haar, no shift per level | |||||||||||||||||
Apple | 240 | 79,2 | 3,0 | 66,1 | 21 | 3,2 | 23 | 7 | 3,2 | ||||||||
Music | 160 | 52,2 | 3,1 | 46 | 16 | 2,9 | 20 | 6,2 | 3,2 | ||||||||
Rio2016 | 361 | 160 | 2,3 | 169 | 74 | 2,3 | 103 | 38 | 2,7 | ||||||||
Wall e | 280 | 92 | 3,0 | 82,8 | 27 | 3,1 | 38 | 12 | 3,0 | ||||||||
В Дираке возможно выбирать несколько вариантов вейвлет функций, как Deslauriers-Debuc(9,7), LeGall(5,3), Deslauriers-Debuc(13,7), Haar, Daubechies и другие[6,7]. Предполагалось, что применив, метод масштабирования (двух кратное уменьшение размеров по вертикали и по горизонтали) перед сжатием кодека Дирак коэффициент сжатия увеличится в 4 раза [2]. Для исследования влияния масштабирования на степень сжатия было выбрана, кодировка YUV444, выбрали первые четыре из вышеперечисленных вейвлет функций, качество из 10: 10–чтобы взять ориентир максимального качества, 7–самое оптимальное хорошее качество [3], 3–качество, где средние объекты изображения, различаемые.
Полученные экспериментальные данные сформированы в табличном виде и представлены в разных таблицах, относительно вейвлет функций.
В таблице столбцы «с» и «без», означают с применением масштабирования и без применения соответственно, К – коэффициент выигрыша от применения масштабирования относительно сжатия без масштабирования.
Из таблицы видно, что коэффициент К в общем случае больше получается при применении масштабирования с вейвлетом Haar, Deslaurers-Dubuc(13,7) и Legal (5,3) относительно одинаковы и чуть меньше предыдущего, не значительно меньше Deslaurers-Dubuc(9,7). Можно также заметить, что масштабирование изображения «Apple», во всех четырех вейвлетах выдает большее степень сжатия, особенно вейвлеты Legal (5,3) и Deslaurers-Dubuc(13,7) дают максимальные значении при качестве 7, 3,5 и 3,6 соответственно.
Выше перечисленные выводы хорошо видны в гистограмме (рис.1), где хорошо заметно, что в изображении Rio2016 коэффициент К заметно меньше, чем в остальных. Это из-за того, что изображение относительно однородное и коэффициенты сжатия сами по себе большие, и выигрыш от применения масштабирования не высок.
Рис.1. Гистограмма коэффициента К в зависимости вейвлет функций.
Не смотря на больший выигрыш (минимум 2,1 раза и максимум 3,6 раз), в этом методе есть недостаток восстановления, которое можно устранить с использованием улучшенных методов демасштабирования.
Вейвлет функции дают хорошее качество восстановленных изображений в больших коэффициентах сжатия [4,5,6]. Применение масштабирования перед вейвлет преобразований дает в среднем трехкратное увеличение коэффициента сжатия, что дает выигрыш в среднем 90 кратном уменьшении размера исходного изображения.
Список литературы:
- Dirac developer support,
- A.Gavrilov, A.N.Puziy, Kh.Kh.Nosirov, Efficiency Estimation And Features Analysis Of Actual Video Codecs, International Journal of Computer Science &Information Technology, IJCSIT, Volume 3, Issue 2 (April 2016). e-ISSN: 1694-2329, p-ISSN: 1694-2345, p.1-5
- Х.Х.Носиров, Т.Г.Рахимов, Комбинированный метод сжатия вещательной видеоинформации, Сборник докладов Республиканской научно-технической конференции «Проблемы информационных и телекоммуникационных технологий», Ташкент 2015
- Бобобекова Д. Б. Исследование зависимости эффективности сжатия изображений от выбора типа вейвлет фильтра. Тезисы доклада в сборнике республиканской научно-технической конференции молодых ученых, исследователей, магистрантов и студентов «Информационные технологии и проблемы телекоммуникаций» часть 4, проходившей 14 марта 2013 г. в Ташкенте. С.178-179.
- Гаврилов И.А., Пузий А.Н. Вейвлет видеокодек с большой величиной сжатия видеопотока. Статья в сборнике докладов Республиканской научно-технической конференции «проблемы информационных и Телекоммуникационных технологий» проходившей 12-13 марта 2015 года в г. Ташкенте ТОМ III c. с.389-392.
- Исмаилова З.А. Анализ интерполяционных методов масштабирования изображений. Статья в сборнике докладов Республиканской научно-технической конференции «проблемы информационных и Телекоммуникационных технологий» проходившей 12-13 марта 2015 года в г. Ташкенте ТОМ III c.408-411
- Мухамедова Д.Б. Обеспечение больших коэффициентов сжатия видеопотоков в реальном масштабе времени. Статья в сборнике докладов Республиканской научно-технической конференции «проблемы информационных и Телекоммуникационных технологий» проходившей 12-13 марта 2015 года в г. Ташкенте ТОМ III c.419-421.
- И.А. Гаврилов И.А., А.Н. Пузий, Р.И. Бабаян. Инструментальное программное обеспечение для оценки эффективности масштабируемых преобразований ТВ изображений. Статья в сборнике статей международной научно-технической конференции «Радиоэлектроника, информационные и телекоммуникационные технологии: проблемы и развитие», проходившей 21-22 мая 2015 г. в Ташкенте . 1-том. с.243-246.
- Э.А.Исмаилова, Х.А.Исмаилов. Инструментальное программное обеспечение для исследования интерполяторов на основе вейвлет фильтров LEGALL 5/3 и DESLAUREIS-DUBUC 9/7[schema type=»book» name=»УМЕНЬШЕНИЕ РАЗМЕРОВ ИЗОБРАЖЕНИЙ ДЛЯ УВЕЛИЧЕНИЯ КОЭФФИЦИЕНТА СЖАТИЯ, И ЕГО ВЛИЯНИЕ НА КАЧЕСТВО ВОССТАНОВЛЕНИЯ В КОДЕКЕ ДИРАК» description=»В статье рассматривается влияния масштабирования изображений на степень сжатия и качество восстановленных изображений в кодеке Dirac. Приводятся результаты исследований вейвлет функций.» author=»Nosirov Khabibullo Khikmatullo o‘g‘li» publisher=»Басаранович Екатерина» pubdate=»2016-12-06″ edition=»euroasia-science_30_22.09.2016″ ebook=»yes» ]