Mpeg для чайников


Содержание

Стандарты MPEG

Слово MPEG является сокращением от Moving Picture Expert Group — названия экспертной группы ISO (международной орга­низации по стандартизации) по кодированию и сжатию видео- и аудиоинформации. Так же называются и стандарты, разработан­ные этой группой.

MPEG 1 предназначен для записи синхронизированных ви­деоизображений (обычно в формате SIF 352×288) и звукового сопровождения на CD-ROM (VideoCD) со скоростью считыва­ния до 1,5 Мбит/с. Качество MPEG 1 примерно соответствует обычному VHS-видео.

MPEG 2 поддерживает более высокие разрешения, поскольку поток данных в этом стандарте намного больше (до 40 Мбит/с), транслируется через телевизионные спутники.

Формат MPEG 4 первоначально создавался для использова­ния в мультимедийных приложениях, использующих узкие кана­лы связи, например видеоконференции, проводимые через Ин­тернет, и не предназначался для хранения видео. По качеству изоб­ражения он занимает промежуточное место между MPEG 1 и MPEG 2. За счет этого достигается высокая степень сжатия ин­формации. Работа с MPEG 4 требует достаточно большой вычис­лительной мощности от всех компонентов компьютера.

Неожиданное применение алгоритм сжатия MPEG 4 получил в качестве средства преобразования DVD-фильмов (формата MPEG 2) с целью их записи на обычные CD-ROM гораздо мень­шей, чем DVD, емкости. Модификация MPEG 4 с таким пред­назначением носит название DivX и обеспечивает вполне прием­лемое качество видеоматериалов.

Стандарт MPEG 7 является еще одним представителем семей­ства MPEG и предназначен для детального описания разнород­ного мультимедийного материала. На его основе, например, мож­но создавать цифровые мультимедийные библиотеки, осуществ­лять поиск мультимедийного материала и мультимедийное редак­тирование. MPEG 7 позволит вести мультимедийный поиск во «всемирной паутине» так же, как и текстовый, на основе предло­женных в качестве образцов мультимедийных фрагментов. Кроме того, можно проводить фильтрацию поступающей информации, вырезая из нее, скажем, рекламу.

Таким образом, лишь стандарт MPEG 1 можно считать уста­ревшим, так как его основной целью являлось обеспечение воз­можности работы на слабых компьютерах. Остальные же стандар­ты не конкурируют друг с другом, поскольку имеют различные области применения.

4 Аппаратные средства мультимедиа

Какая же аппаратура нужна для работы с мультимедиа-инфор­мацией? Следует различать средства, предназначенные для под­готовки аудио- и видеофайлов и других мультимедиа-продуктов, и средства, предназначенные для их воспроизведения. Связано это, в первую очередь, с тем, что для преобразования аналоговой ин­формации в цифровую требуется компрессия (сжатие) информа­ции, а для обратного преобразования — декомпрессия, которая происходит гораздо быстрее и требует меньшего количества ре­сурсов. Кроме того, требования к аппаратуре очень сильно зависят от требований, предъявляемых к конечному продукту.

Если же ограничиться непрофессиональным уровнем, то современный компьютер может реализовать практически все компьютерные технологии мультимедиа.

При изготовлении продуктов мультимедиа заметно повышается требования к быстродействию процессора и жесткого диска, который должен работать в режиме не ниже Ultra DMA. Необходимо также наличие видеовхода либо на видеоплате, либо отдельного устройства — телевизионного тюнера. Для профессиональной же работы используются специализированные платы видеозахвата, которые могут работать с большими разрешениями и сжимать вводимое видеоизображение. Для создания музыкальных фрагментов необходимы музыкальные синтезаторы, производящие звучание реальных музыкальных инструментов.

Качество воспроизведения аудио- и видеоматериалов компьютерными средствами уступает не только профессиональной, но и бытовой аппаратуре. Однако комплексность компьютерных технологий и удобство управления всем про­сом работы делают использование компьютера в подготовке мультимедиа-продуктов незаменимым.

Не нашли то, что искали? Воспользуйтесь поиском:

wiki.vspu.ru

портал образовательных ресурсов

Содержание

Семейство форматов MPEG

Введение

Необработанный цифровой видеосигнал занимает большой объём памяти для хранения. Непрактично передавать или хранить цифровое видео в первоначальной необработанной форме, потому что изображения содержат слишком много излишней информации. Разумное решение заключается в том, чтобы сжимать видео перед тем, как передавать или сохранять его, и восстанавливать сжатые данные, когда это необходимо. Поскольку видеосигнал содержит естественную избыточность информации в виде статических областей, повторяющихся изображений, областей подобной текстуры и циклического движения, такой подход может быть довольно эффективен.

Сжатие конторолируется кодером — устройством, которое анализирует поступающую видеопоследовательность, находит избыточность информации и создаёт поток двоичных кодов, который описывает последовательность в соответствии с некоторой математической моделью кодирования видео. Когда требуется несжатое видео, декодер берет эти двоичные коды и восстанавливает последовательность в соответствии с той же моделью. Пара кодер-декодер называется КОДЕКОМ, КОдер-ДЕКодер.

История

The Motion Picture Expert Group (MPEG) работает над созданием спецификаций для аудиовизуального кодирования под контролем Международной организации по стандартизации (ISO) и Международной электротехнической комиссии, МЭК, (International Electrotechnical Commission — IEC). В большинстве случаев под понятием «MPEG VIDEO » понимают стандарты MPEG-1, MPEG-2, и MPEG-4, которые создавались в течение прошлых 10 лет в связи с растущим спросом на технологии видео и аудио сжатия и быстро увеличивающейся вычислительной мощностью электронных устройств. H.264/AVC — новейший утверждённый стандарт видео кодирования. Он появился в результате совместной разработки экспертной группы по видео кодированию Международного союза телекоммуникаций (International Telecommunication Union Video Coding Experts Group — ITU VCEG) и MPEG ISO. Этот стандарт известен как H.264 (имя, данное ITU-T — сектором телекоммуникаций Международного союза телекоммуникаций), или MPEG-4 Part 10 (ISO/IEC 14496-10), или MPEG-4 усовершенствованное видео кодирование (Advanced Video Coding — AVC).

Определение

MPEG(англ. Moving Picture Experts Group — русск. Экспертная группа по вопросам движущегося изображения) — это группа людей в ISO (Internation Standards Organization), которые встречаются для выработки стандартов сжатия цифрового видео и аудио. В частности, они определили сжатый поток и декомпрессор для него. Алгоритмы сжатия определяются индивидуально каждым производителем, в чем и достигается преимущество в рамках опубликованного международного стандарта. Группа MPEG собирается приблизительно четыре раза в год примерно на неделю. Основная работа делается между встречами, будучи организованной и спланированной на них.

Разновидность форматов MPEG

MPEG (произносится, как ЭМ-пег) стандартизовала следующие стандарты сжатия и вспомогательные стандарты:

o MPEG-4 Part 2 (ASP) и

В дополнении, к рассмотренным стандартам, рассмотрим стандарты которые являются не усовершенствованием предыдущих стандартов сжатия, а описывают различные языки описания:

Принципы сжатия


Цветное цифровое изображение из сжимаемой последовательности переводится в цветовое пространство YUV (YCbCr). Компонента Y представляет собой интенсивнось, а U и V — цветность. Так как человеческий глаз менее восприимчив к цветности, чем к интенсивности, то разрешений цветовых компонент может быть уменьшено в 2 раза по вертикали, или и по вертикали и по горизонтали. К анимации и высококачественному студийному видео уменьшение разрешения не применяется для сохранения качества, а для бытового применения, где потоки более низкие, а аппаратура более дешевая, такое действие не приводит к заметным потерям в визуальном восприятии, сохраняя в то же время драгоценные биты данных.

Основная идея всей схемы — это предсказывать движение от кадра к кадру, а затем применить дискретное косинусное преобразование (ДКП), чтобы перераспределить избыточность в пространсве. ДКП выполняется на блочках 8х8 точек, предсказание движения выполняется на канале интенсивности (Y) на блоках 16х16 точек, или, в зависимости от характеристик исходной последовательности изображении (черезстрочная развертка, содержимое), на блоках 16х8 точек. Другими словами, данный блок 16х16 точек в текущем кадре ищется в соответсвующей области большего размера в предыдущих или последующих кадрах. Коэфициентны ДКП (исходных данных или разности этого блока и ему соответсвующего) квантуются, то есть делятся на некоторое число, чтобы отбросить несущественные биты. Многие коэфициенты после такой операции оказываются нулями. Коэфициент квантизации может изменяться для каждого «макроблока» (макроблок — блок 16х16 точек из Y-компонент и соответсвующие блоки 8х8 в случае отношения YUV 4:2:0, 16х8 в случае 4:2:2 и 16х16 в случае 4:4:4. Коэфициенты ДКП, параметры квантизации, векторы движения и пр. кодируется по Хаффману с использованием фиксированных таблиц, определенных стандартом. Закодированные данные складываются в пакеты, которые формируют поток согласно синтаксису MPEG.

Принципы соотношения кадров при кодировании

Существует три типа закодированных кадров. I-фремы — это кадры, закодированные как неподвижные изображения — без ссылок на последующие или предыдущие. Они используются как стартовые. P-фреймы — это кадры, предсказаные из предыдущих I- или P-кадров. Каждый макроблок в P-фрейме может идти с вектором и разностью коэфициентов ДКП от соответвующего блока последнего раскодированного I или P, или может быть закодирован как в I, если не соответсвующего блока не нашлось.

И, наконец, существуют B-фреймы, которые предсказаны из двух ближайших I или P-фреймов, одного предыдущего и другого — последующего. Соответсвующие блоки ищутся в этих кадрах и из них выбирается лучший. Ищется прямой вектор, затем обратный и вычисляется среднее между соответсвующими макроблоками в прошлом и будущем. Если это не работает, то блок может быть закодирован как в I-фрейме.

Последовательность раскодированных кадров обычно выглядит как I B B P B B P B B P B B I B B P B B P B …

Здесь 12 кадров от I до I фрейма. Это основано на требовании произвольного доступа, согласно которому начальная точка должна повторяться каждые 0.4 секунды. Соотношение P и B основано на опыте.

Чтобы декодер мог работать, необходимо, чтобы первый P-фрейм в потоке встретился до первого B, поэтому сжатый поток выгдядит так: 0 x x 3 1 2 6 4 5 …

где числа — это номера кадров. xx может не быть ничем, если это начало последовательности, или B-фреймы -2 и -1, если это фрагмент из середины потока.

Сначала необходимо раскодировать I-фрейм, затем P, затем, имея их оба в памяти, раскодировать B. Во время декодирования P показывается I-фрейм, B показываются сразу, а раскодированный P показывается во время декодирования следующего.

Сжатие аудио-потоков

При сжатии аудио используются хорошо разработанные психоакустические модели, полученные из экспериментов с самыми взыскательными слушателями, чтобы выбросить звуки, которые не слышны человеческому уху. Это то, что называется «маскированием», например, большая составляющая в некоторой частоте не позволяет услышать компоненты с более низким коэфициентом в близлежащих частотах, где соотношение между энергиями частот, которае маскируются, описывается некоторой эмпирической кривой. Существуют похожие временные эффекты маскирования, а также более сложные взаимодействия, когда временной эффект может выделить частоту или наоборот.

Звук разбивается на спектральные блоки с помощью гибридной схемы, которая объединяет синусные и полосные преобразования, и психоакустической модели, описанной на языке этих блоков. Все, что может быть убрано или сокращено, убирается и сокращается, а остаток посылается в выходной поток. В действительности, все выглядит несколько сложнее, поскольку биты должны распределяться между полосами. И, конечно же, все, что посылается, кодируется с сокращением избыточности.

Интересные факты

1. Коэфициет сжатия свыше 100:1 Зачастую статьи в прессе и маркетинговой литературе заявляют, что MPEG достигает необычайно высокого качества видео при степени сжатия свыше 100:1, тогда как в действительности он находися в районе от 8:1 до 30:1. Эти заявления обычно не включают понижение цветового разрешения исходного цифрового изображения. Предварительное сжатие за счет уменьшения цветового разрешения играет основную роль в формировании коэфициетнов сжатия с 3 нулями во всех методах кодирования видео, включая отличные от MPEG.

2. MPEG-1 всегда 352×240 Как MPEG-1, так и MPEG-2, могут быть применены к широкому классу потоков, частот и размеров кадров. MPEG-1, знакомый большинству людей, позволяет передавать 25 кадров/с с разрешением 352×288 в PAL или 30 кадр/с с разрешением 352×240 в NTSC при величине потока менее 1.86 Мбит/с — комбинация, известная как «Constrained Parameters Bitstreams». Это цифры введены спецификацией White Book для видео на CD (VideoCD).

Фактически, синтаксис позволяет кодировать изображения с разрешением до 4095х4095 с потоком до 100 Мбит/с. Эти числа могли бы быть и бесконечными, если бы не ограничение на количество бит в заголовках.

С появлением спецификации MPEG-2, самые популярные комбинации были объединены в уровни и профили. Самые общие из них:

Область примененния

Декодеры и кодеры Elecard позволяют создавать продукты ТВ-вещания высокого качества благодаря современной технологии. Elecard предлагает следующие решения для рынка цифрового ТВ-вещания: Редактирование

Elecard обеспечивает декодирование HDTV (720p@30Hz) в реальном времени на одном стандартном компьютере, для H.264, на битрэйтах до 20 Мб/с. Простота кодирования разрешения D1 в реальном времени при самом высоком качестве позволяет делать редактирование очень удобным для каждого пользователя.

Кодирование в реальном времени, в зависимости от требуемых битрэйтов, позволяет сохранять и создавать видео с необходимым битрэйтом.

Декодеры и кодеры Elecard обеспечивают декодирование и кодирование видео на Вашем ПК — из любого источника и в соответствии с любым стандартом. К тому же решения Elecard в кодировании с низким битрэйтом позволяют использовать каждый ПК в качестве PVR (персональных видео рекордеров) благодаря эффективному использованию памяти диска. Так как способ полностью основывается на ПО, технология Elecard позволяет сделать из персонального медиа центра домашнюю студию видеомонтажа.

Технология Elecard обеспечивает декодирование и кодирование на недорогих ЦСП (цифровых сигнальных процессорах). Это позволяет использовать решения Elecard в бытовой электронике, включая:

Кодеки Elecard, включая декодеры и кодеры MPEG-2 и H.264 в реальном времени на базе ПК и ЦСП, успешно используются производителями ПО в продуктах для видеонаблюдения.

Урок 14. Форматы видеофайлов

Добрый день! Сегодня хотелось бы немного рассказать вам о форматах видеофайлов. Существует множество форматов видеофайлов. Они отличаются, в основном, методом кодирования видео.

По своей сути видеофайл — это набор статичных изображений, меняющих друг друга с определенной частотой. Каждое статичное изображение является отдельным кадром видео. Это действительно так, если мы говорим о несжатом видео. Однако, в таком формате никто не хранит фильмы. Дело в том, что несжатое видео занимает на диске очень много места. Кадр видео формата PAL состоит из 720 точек по горизонтали и 576 по вертикали. То есть, один кадр состоит из 414720 точек. Для хранения цвета каждой точки в памяти отводится 24 бита (по 8 бит для каждой из составляющих RGB). Следовательно, для хранения одного кадра понадобится 9953280 бит (или примерно 1,2 Мбайт). То есть, секунда несжатого видео в формате PAL будет занимать почти 30 Мбайт. А один час такого видео… более 100 Гбайт. Каким же образом полнометражный фильм (а то и несколько) умещается на одном компакт диске или флэш-накопителе? Дело в том, что, в основном, видео хранят в видеофайлах, в которых применены различные алгоритмы сжатия информации. Благодаря этим технологиям видеофайл можно сжимать в десятки и сотни раз практически без потери качества картинки и звука.

Работая над фильмом, вы уже познакомились с одним из форматов сжатого видео. Это формат DV, который представляет собой потоковое видео, упакованное в, так называемый контейнер, — файл формата AVI. Многие считают данный формат форматом несжатого видео, поскольку видеофайлы DV занимают на диске достаточно много места. Действительно, один час видео формата DV занимает около 13 Гбайт дискового пространства. Однако, это почти в 10 раз меньше, чем один час несжатого видео. Видео формата DV содержит информацию обо всех кадрах, поэтому легко поддается редактированию. Но готовые видеофильмы хранить в таком формате неудобно. Во-первых, вы не уместите полнометражный фильм на оптический диск. Во-вторых, бытовые DVD-проигрыватели и, тем более, портативные устройства не поддерживают воспроизведение данного формата видео. Сохранять видео в DV формате целесообразно в том случае, если позже вы хотите редактировать данный фильм, например, разрезать его на сцены и переставить сцены местами.

Домашняя видеотека, как правило, хранится в видеофайлах сжатого формата. Существует большое количество форматов сжатого видео. Наибольшее распространение получили форматы MPEG-1, MPEG-2, MPEG-4, DivX, Windows Media Video и некоторые другие. Рассмотрим вкратце эти форматы сжатия.


MPEG-1

MPEG-1 считается уже устаревшим форматом сжатия видео. Он был разработан с целью достижения приемлемого качества воспроизведения видео при потоке 1,5 Мегабита в секунду для разрешения 352х240 точек. Формат не поддерживает чересстрочную развертку, что считается его недостатком. Да и качество видеоизображения далеко от совершенства.

Формат MPEG-1 являлся основой видео формата VideoCD. Полнометражный фильм, как правило, размещался на двух-трех CD дисках, а качество изображения фильма было сравнимо с качеством VHS. Диски формата VideoCD, а также файлы формата MPEG-1 можно воспроизвести практически на любых компьютерах без установки дополнительных кодеков. Файлы формата MPEG-1 могут иметь расширение MPG, MPEG или DAT.

Компрессоры и декомпрессоры

Кодек (CoDec) — это сокращение слов «компрессор и декомпрессор». По сути, кодек — это набор файлов, драйверов и библиотек, необходимых для упаковки видео или звукового файла в сжатый формат и воспроизведения сжатого файла.

MPEG-2

С форматом MPEG-2 знакомы, пожалуй, все. Именно этот формат лежит в основе дисков формата DVD-Video. Формат MPEG-2 также лежит в основе стандартов цифрового телевидения.

Формат MPEG-2 обеспечивает высокое качество изображения при достаточно высокой степени сжатия видеофайла. Он обеспечивает изображение с четкостью 720 на 576 точек. Также формат MPEG-2 лежит в основе видео формата HDV.

Размер файла формата MPEG-2, конечно, в первую очередь зависит от длительности видеофайла. Но немаловажную роль играет и установленная степень компрессии. При создании файлов MPEG-2 пользователь может задать нужный поток данных (битрейт) и от этого битрейта будет зависеть как объем файла, так и качество видео. Чем выше битрейт, то есть, объем памяти, выделяемый для хранения одной секунды видео, тем выше объем видеофайла и качество изображения.

Видеофайлы формата MPEG-2 имеют разрешение MPG или MPEG. Если файл кодируется в отдельные потоки (аудио и видео), создается два файла с расширениями M2V (видео) и M2A (звук). В операционных системах Windows 7 и Windows Vista файлы формата MPEG-2 можно воспроизводить без установки дополнительных кодеков. Необходимые кодеки уже встроены в систему. В более ранних версиях Windows для воспроизведения файлов формата MPEG-2, а также дисков формата DVD-Video требуется установка дополнительных кодеков или специальных программ, например, CyberLink PowerDVD, в которые уже встроены кодеки для распаковки файлов формата MPEG-2. Также формат MPEG-2 поддерживается большинством устройств для воспроизведения видео, например, бытовыми проигрывателями DVD.

Формат MPEG-2 удобен для хранения готового фильма, но нежелателен для использования при монтаже видео, так как в файлах данного формата содержится достоверная информация только об опорных кадрах. Вследствие этого точный монтаж, например нахождение конкретного кадра, практически невозможен. Некоторые программы для монтажа видео, например, Pinnacle Studio, позволяют захватывать видеоматериал с кассеты, сразу кодируя его в формат MPEG-2. Это позволяет сэкономить место на диске, однако, для качественного монтажа лучше все же использовать формат DV. Вероятно, именно по этой причине возможность захвата видео в формат MPEG-2 отсутствует в программах для монтажа видео профессионального уровня, например, в Sony Vegas Pro. Однако, стоит отметить, что видео HDV переносится на компьютер именно в формате MPEG-2 с битрейтом 25 Мбит в секунду, что обеспечивает высокое качество изображения.

MPEG-4

Формат MPEG-4 появился в 1998 году. Он был предназначен для сжатия цифрового видео и звука и в своей основе содержит принципы сжатия, используемые в форматах MPEG-1 и MPEG-2. Однако, как мы знаем, полнометражный фильм в формате MPEG-2 обычно умещается на одном DVD диске, в то время как такой же фильм, сжатый алгоритмом MPEG-4 может свободно поместиться на одном CD диске, емкость которого в 6 раз меньше. Как это возможно?

Формат MPEG-4, также как и MPEG-2, предусматривает хранение опорных кадров, то есть, кадров, в которых картинка в кадре существенно меняется. Однако, данный формат не хранит в себе промежуточные кадры, как MPEG-2. Вместо этого в файле MPEG-4 хранится информация об изменениях (в том числе и прогнозируемых) в картинке между двумя опорными кадрами. Кроме того полученная информация об изменениях сжимается так же, как сжимается файл с помощью программ для архивирования данных.

Формат MPEG-4 имеет множество разновидностей и используется в самых разных устройствах. Например, некоторые цифровые фотокамеры имеют функцию съемки видео с последующим сохранением его в одну из разновидностей формата MPEG-4.

На основе формата MPEG-4 создано немало других более популярных форматов, использующих тот же алгоритм сжатия данных.

DivX (Xv >Формат DivX появился в результате взлома алгоритма MPEG-4. Формат DivX содержит те же принципы компрессии, что и кодек MPEG-4, однако он был существенно доработан и продолжает активно развиваться. Целью создания такого кодека была продажа фильмов на обычных компакт дисках, цена которых была невысока. Так как в те годы (кодек DivX версии 3,11 был опубликован в Интернете в 1999 году) стоимость устройств, способных записывать DVD диски, была достаточно высока, а привод, записывающий диски CD был уже почти обязательным компонентом компьютерной системы, формат DivX получил огромную популярность. Качество картинки видео, сжатого в формате DivX (в зависимости от установленных параметров сжатия) может не уступать качеству DVD диска, но видеофайл по сравнению с форматом DVD имеет размеры в 6-8 раз меньше.

В 2002 году кодек DivX стал коммерческим, но это не говорит о том, что для воспроизведения фильмов в формате DivX нужно приобретать соответствующий декомпрессор. Базовая версия, являющаяся бесплатной, позволяет воспроизводить видео, соответствующее по качеству сертифицированной версии MPEG-4, в то время как коммерческая версия содержит в себе дополнительные возможности, при которых можно добиться высокого качества изображения при более низких битрейтах.

Илон Маск рекомендует:  Как выбрать фен для домашнего использования

На основе ранних версий DivX, исходный код которых был открытым, был разработан кодек Xvid, который является прямым конкурентом DivX Pro, хотя и использующий те же принципы компрессии видео и звука. В отличие от DivX, Xvid является некоммерческим продуктом, и файлы для установки данного кодека можно вполне легально скачать из Интернета.

Файлы форматов DivX и Xvid могут иметь разное расширение, но чаще всего они упакованы в контейнеры AVI. Воспроизводить такие файлы можно на компьютерах, на которых установлены соответствующие декомпрессоры. Кроме того, поддержку воспроизведения файлов DivX и Xvid имеет большинство современных устройств, в том числе, портативные проигрыватели и некоторые мобильные телефоны.

Windows Media

Формат Windows Media разработан компанией Microsoft и предназначен для хранения сжатого видео и звука. Формат обеспечивает качественное видеоизображение и звук, не уступающее, а иногда и превосходящее качество DivX и MPEG-2, при менее сложном алгоритме сжатия. При этом размеры готового видеофайла сопоставимы с размерами файлов DivX, а размер звуковых файлов Windows Media сопоставим с размерами файлов популярного формата MP3.

В основе сжатия Windows Media лежит упрощенный алгоритм MPEG-2, однако данный формат требует вдвое меньшей скорости потока, что существенно уменьшает размер файла.

К преимуществам данного кодека можно отнести то, что все необходимые для компрессии и декомпрессии файлов компоненты уже содержатся в операционной системе Windows, что избавляет пользователя от установки дополнительных кодеков.

Формат подразумевает два вида файлов с расширениями, соответственно MMV (Windows Media Video) и WMA (Windows Media Audio). Файлы формата WMV предназначены для хранения видео, в том числе и со звуковой составляющей. Формат WMA предназначен только для хранения звука. Неоспоримым преимуществом формата Windows Media по сравнению со многими другими форматами является способность хранить до шести звуковых каналов, что позволяет упаковывать в данный формат фильмы с объемным звуковым сопровождением (5,1).

Контейнеры

Многие пользователи путают такие понятия как «формат» и «контейнер» файла. Часто можно услышать фразу типа «файлы формата AVI». Это выражение лишь отчасти верное, поскольку, действительно, AVI является зарегистрированным форматом файла. Однако в файле с расширением AVI может храниться несжатое видео, видео в форматах DV, MPEG-4, DivX, Xvid и даже MPEG-1 и MPEG-2. Кроме того, файл формата AVI может, например, содержать в себе только звук. То есть, файлы формата AVI являются контейнером для хранения данных различного типа.

Контейнер — это файл с каким либо расширением, служащий для хранения в цифровом виде преобразованной аналоговой информации. Некоторые контейнеры могут хранить служебную информацию. Так, например, в видеофайл могут быть включены титры, которые являются не частью видеоизображения, а обычным текстом. Ряд проигрывателей имеют возможность включать или отключать отображение титров в кадре. То есть, контейнер является файлом некоего стандарта, в котором одновременно может содержаться несколько различных типов информации.

Ниже приведен список наиболее распространенных контейнеров для хранения видео и звука:

  • AVI. Данный вид файлов наиболее распространен, однако, он имеет ряд ограничений. Например, в нем может содержаться только одна стерео дорожка звука, что делает его непригодным для хранения фильмов с объемным звуком или фильмов со звуковым сопровождением на нескольких языках. Тем не менее, данный контейнер по-прежнему остается самым распространенным.
  • OGG (OGM). Изначально контейнер разрабатывался для хранения звука, однако позже обнаружилось, что он может содержать видео и информацию о титрах. Контейнер, в основном, предназначался для потоковой передачи данных через Интернет, поэтому не очень хорошо подходит именно для хранения аудио и видео информации. В ряде случаев вы не сможете перемотать видео или звуковой трек на нужное место.
  • MKV. Данный контейнер, появившийся сравнительно недавно, значительно превышает по своим возможностям файлы формата AVI. Помимо видео и звуковой информации контейнер MKV может хранить в себе информацию о титрах, а также навигационные меню (подобные меню DVD дисков) и ссылки на разделы фильма. В контейнер MKV могут быть упакованы видео и аудио самых различных форматов, что, возможно, сделает данный вид контейнера распространенным. Однако в настоящее время воспроизведения файлов формата MKV поддерживает небольшое количество устройств, а для воспроизведения таких файлов на компьютере необходимо устанавливать специальные программные модули, способные разделить потоки информации различных типов.
  • MP4. Это контейнер разработан группой MPEG (Moving Picture Experts Group — группа экспертов по движущемуся изображению). Он предназначен для хранения видео, аудио информации, а также некоторых видов анимации. Контейнер поддерживает различные форматы звукового сжатия, в том числе и многоканальные. Зачастую контейнер MP4 используется в различных портативных устройствах.
  • Quick Time. Данный контейнер, в первую очередь предназначен для использования на компьютерных платформах Apple. Файлы с расширением MOV содержат сжатое видео и звук, при этом качество и разрешение видео может быть очень высоким. Контейнеры Quick Time, конечно, можно использовать на компьютерных платформах PC, для этого нужно установить соответствующее программное обеспечение. Однако многие программы не поддерживают работу с файлами данного формата или некорректно с ним работают.


Я лишь поверхностно описал принципы и устройства различных форматов и контейнеров. Это очень большая тема, которая не укладывается в рамки одного урока. На практике вам, скорее всего, придется иметь дело с двумя-тремя форматами сжатия видео и двумя-тремя разновидностями контейнеров. Однако, если вы всерьез займетесь видеомонтажом, рано или поздно вы можете столкнуться с очень необычными форматами сжатия. Например, производители цифровых камер, снимающих видео на флэш-накопитель или фотокамер с функцией съемки видео, не имеют какого-то общего соглашения по используемому формату сжатия. И вам могут попадаться носители с совершенно разными форматами файлов видео и звука. Если программа Sony Vegas Pro отказывается работать с некоторыми из таких файлов, придется воспользоваться специальными программами, перекодирующими различные форматы видео в формат AVI. Такие программы можно найти в Интернете. Некоторые из них распространяются бесплатно, некоторые являются коммерческими продуктами и доступны в Интернете в виде пробных версий.

Формат MPEG — спецификация и возможности

В настоящее время у каждого любителя видео имеется возможность для создания собственной домашней видеостудии на базе персонального компьютера. Известно, что при работе с видеофайлами возникает необходимость обработки и хранения очень больших объемов информации, например одна минута цифрового видеосигнала с разрешением SIF (сопоставимым с VHS) и цветопередачей true color (миллионы цветов), займет (288 x 358) пикселов x 24 бита x 25 кадров/с x 60 c = 442 Мб, то есть на носителях, используемых в современных ПК, таких, как компакт-диск (CD-ROM, около 650Мб) или жеский диск (несколько десятков гигабайт) сохранить полноценное по времени видео, записанное в таком формате не удастся. С помощью MPEG-сжатия объем видеоинформации можно заметно уменьшить без заметной деградации изображения. О том, как работает MPEG и какие еще он имеет применения, и пойдет речь далее.

Слово MPEG является сокращением от Moving Picture Expert Group — названия экспертной группы ISO, действующая в направлении разработки стандартов кодирования и сжатия видео- и аудио- данных. Официальное название группы — ISO/IEC JTC1 SC29 WG11. Часто аббревиатуру MPEG используют для ссылки на стандарты, разработанные этой группой. На сегодняшний день известны следующие:

  • MPEG-1 предназначен для записи синхронизированных видеоизображения (обычно в формате SIF, 288 x 358) и звукового сопровождения на CD-ROM с учетом максимальной скорости считывания около 1.5 Мбит/с. Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители.
  • MPEG-2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, а в профессиональной аппаратуре используют потоки скоростью до 50 Мбит/с. На технологии, основанные на MPEG-2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объемов видеоматериала.
  • MPEG-3 — предназначался для использования в системах телевидения высокой четкости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG-Audio Layer-3.
  • MPEG-4 — задает принципы работы с цифровым представлением медиа-данных для трех областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения.

КАК ПРОИСХОДИТ СЖАТИЕ

Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра. Исходные (Intra) кадры кодируются только с применением внутрикадрового сжатия по алгоритмам, аналогичным используемым в JPEG. Кадр разбивается на блоки 8×8 пикселов. Над каждым блоком производится дискретно-косинусное преобразование (ДКП) с последующим квантованием полученных коэффициентов. Вследствии высокой пространственной корелляции яркости между соседними пикселами изображения, ДКП приводит к концентрации сигнала в низкочастотной части спектра, который после квантования эффективно сжимается с использованием кодирования кодами переменной длины. Обработка предсказуемых (Predicted) кадров производится с использованием предсказания вперед по предшествующим исходным или предсказуемым кадрам. Кадр разбивается на макроблоки 16×16 пикселов, каждому макроблоку ставится в соответствие наиболее похожий участок изображения из опорного кадра, сдвинутый на вектор перемещения. Эта процедура называется анализом и компенсацией движения. Допустимая степень сжатия для предсказуемых кадров превышает возможную для исходных в 3 раза. В зависимости от характера видеоизображения, кадры двунаправленной интерполяции (Bi-directional Interpolated ) кодируются одним из четырех способов: предсказание вперед; обратное предсказание с компенсацией движения — используется когда в кодируемом кадре появляются новые объекты изображения; двунаправленное предсказание с компенсацией движения; внутрикадровое предсказание — при резкой смене сюжета или при высокой скорости перемещения злементов изображения. С двунаправленными кадрами связано наиболее глубокое сжатие видеоданных, но, поскольку высокая степень сжатия снижает точность восстановления исходного изображения, двунаправленние кадры не используются в качестве опорных. Если бы коэффициенты ДКП передавались точно, восстановленное изображение полностью совпадало бы с исходным. Однако ошибки восстановления коэффициентов ДКП, связванные с квантованием, приводят к искажениям изображения. Чем грубее производится квантование, тем меньший объем занимают коэффициенты и тем сильнее сжатие сигнала, но и тем больше визуальных искажений.

Благодаря тому, что MPEG разрабатывается в такой авторитетной организацией как ISO и является достаточно универсальным методом сжатия (может использоваться в видеозаписи, телевещании, домашнем видеомонтаже, мультимедийных программах (обучающих, игровых) телеконференциях создании видеороликов для презентаций в Интернет) он стал доминирующим стандартом сжатия цифрового видео, избавив от необходимости использования множества существовавших до него несовместимых способов сжатия видео.

Как работает MPEG-видео

Цветное цифровое изображение из сжимаемой последовательности переводится в цветовое пространство YUV (YCbCr). Компонента Y представляет собой интенсивность, а U и V — цветность. Так как человеческий глаз менее восприимчив к цветности, чем к интенсивности, то разрешений цветовых компонент может быть уменьшено в 2 раза по вертикали, или и по вертикали и по горизонтали. К анимации и высококачественному студийному видео уменьшение разрешения не применяется для сохранения качества, а для бытового применения, где потоки более низкие, а аппаратура более дешевая, такое действие не приводит к заметным потерям в визуальном восприятии, сохраняя в то же время драгоценные биты данных.

Основная идея всей схемы — это предсказывать движение от кадра к кадру, а затем применить дискретное косинусное преобразование (ДКП), чтобы перераспределить избыточность в пространстве. ДКП выполняется на блочках 8×8 точек, предсказание движения выполняется на канале интенсивности (Y) на блоках 16×16 точек, или, в зависимости от характеристик исходной последовательности изображении (черезстрочная развертка, содержимое), на блоках 16×8 точек. Другими словами, данный блок 16×16 точек в текущем кадре ищется в соответствующей области большего размера в предыдущих или последующих кадрах. Коэффициенты ДКП (исходных данных или разности этого блока и ему соответствующего) квантуются, то есть делятся на некоторое число, чтобы отбросить несущественные биты. Многие коэффициенты после такой операции оказываются нулями. Коэффициент квантизации может изменяться для каждого «макроблока» (макроблок — блок 16×16 точек из Y-компонент и соответсвующие блоки 8×8 в случае отношения YUV 4:2:0, 16×8 в случае 4:2:2 и 16×16 в случае 4:4:4. Коэффициенты ДКП, параметры квантизации, векторы движения и пр. кодируется по Хаффману с использованием фиксированных таблиц, определенных стандартом. Закодированные данные складываются в пакеты, которые формируют поток согласно синтаксису MPEG.

Соотношение и типы кадров

Существует три типа закодированных кадров. I-фремы — это кадры, закодированные как неподвижные изображения — без ссылок на последующие или предыдущие. Они используются как стартовые. P-фреймы — это кадры, предсказанные из предыдущих I- или P-кадров. Каждый макроблок в P-фрейме может идти с вектором и разностью коэффициентов ДКП от соответствующего блока последнего раскодированного I или P, или может быть закодирован как в I, если не соответствующего блока не нашлось.

И, наконец, существуют B-фреймы, которые предсказаны из двух ближайших I или P-фреймов, одного предыдущего и другого — последующего. Соответсвующие блоки ищутся в этих кадрах и из них выбирается лучший. Ищется прямой вектор, затем обратный и вычисляется среднее между соответствующими макроблоками в прошлом и будущем. Если это не работает, то блок может быть закодирован как в I-фрейме.

Последовательность раскодированных кадров обычно выглядит как
I B B P B B P B B P B B I B B P B B P B .

Здесь 12 кадров от I до I фрейма. Это основано на требовании произвольного доступа, согласно которому начальная точка должна повторяться каждые 0.4 секунды. Соотношение P и B основано на опыте.

Чтобы декодер мог работать, необходимо, чтобы первый P-фрейм в потоке встретился до первого B, поэтому сжатый поток выглядит так:
0 x x 3 1 2 6 4 5 .
где числа — это номера кадров. xx может не быть ничем, если это начало последовательности, или B-фреймы -2 и -1, если это фрагмент из середины потока.
Сначала необходимо раскодировать I-фрейм, затем P, затем, имея их оба в памяти, раскодировать B. Во время декодирования P показывается I-фрейм, B показываются сразу, а раскодированный P показывается во время декодирования следующего.

Алгоритм MPEG-компрессии аудио

При сжатии аудио используются хорошо разработанные психоакустические модели, полученные из экспериментов с самыми взыскательными слушателями, чтобы выбросить звуки, которые не слышны человеческому уху. Это то, что называется «маскированием», например, большая составляющая в некоторой частоте не позволяет услышать компоненты с более низким коэффициентом в близлежащих частотах, где соотношение между энергиями частот, которое маскируются, описывается некоторой эмпирической кривой. Существуют похожие временные эффекты маскирования, а также более сложные взаимодействия, когда временной эффект может выделить частоту или наоборот.

Звук разбивается на спектральные блоки с помощью гибридной схемы, которая объединяет синусные и полосные преобразования, и психоакустической модели, описанной на языке этих блоков. Все, что может быть убрано или сокращено, убирается и сокращается, а остаток посылается в выходной поток. В действительности, все выглядит несколько сложнее, поскольку биты должны распределяться между полосами. И, конечно же, все, что посылается, кодируется с сокращением избыточности.

Потоки, частоты и размеры кадров

Как MPEG-1, так и MPEG-2, могут быть применены к широкому классу потоков, частот и размеров кадров. MPEG-1, знакомый большинству людей, позволяет передавать 25 кадров/с с разрешением 352×288 в PAL или 30 кадр/с с разрешением 352×240 в NTSC при величине потока менее 1.86 Мбит/с — комбинация, известная как «Constrained Parameters Bitstreams». Это цифры введены спецификацией White Book для видео на CD ( VideoCD ).

Фактически, синтаксис позволяет кодировать изображения с разрешением до 4095×4095 с потоком до 100 Мбит/с. Эти числа могли бы быть и бесконечными, если бы не ограничение на количество бит в заголовках.

С появлением спецификации MPEG-2, самые популярные комбинации были объединены в уровни и профили. Самые общие из них:

  • Source Input Format (SIF), 352 точки x 240 линий x 30 кадр/с, известный также как Low Level (LL) — нижний уровень, и
  • «CCIR 601» (например 720 точек/линию x 480 линий x 30 кадр/с), или Main Level — основной уровень.

Компенсация движения заменяет макроблоки макроблоками из предыдущих картинок
Предсказания макроблоков формируются из соответсвующих 16×16 блоков точек (16×8 в MPEG-2) из предыдущих восстановленных кадров. Никаких ограничений на положение макроблока в предыдущей картинке, кроме ее границ, не существует.

Исходные кадры — reference — (из которых формируются предсказания) показаны безотносительно своей закодированной формы. Как только кадр раскодирован, он становится не набором блоков, а обычным плоским цифровым изображением из точек.


В MPEG размеры отображаемой картинки и частота кадров может отличаться от закодированного в потоке. Например, перед кодированием некотрое подмножество кадров в исходной последовательности может быть опущено, а затем каждый кадр фильтруется и обрабатывается. При восстановлении интерполированы для восстановления исходного размера и частоты кадров. Фактически, три фундаментальных фазы (исходная частота, кодированная и показываемая) могут отличаться в параметрах. Синтаксис MPEG описывает кодированную и показываемую частоту через заголовки, а исходная частота кадров и размер известен только кодеру. Именно поэтому в заголовки MPEG-2 введены элементы, описывающие размер экрана для показа видеоряда.
В I-фрейме макроблоки должны быть закодированы как внутренние — без ссылок на предыдущие или последующие, если не используются масштабируемые режимы. Однако, макроблоки в P-фрейме могут быть как внутренними, так и ссылаться на предыдущие кадры. Макроблоки в B-фрейме могут быть как внутренними, так и ссылаться на предыдущий кадр, последующий или оба. В заголовке каждого макроблока есть элемент, определяющий его тип.

Без компенсации движения:

С компенсацией движения:

Пропущенные макроблоки в P-фреймах:

Пропущенные макроблоки в B-фреймах:

Последовательность кадров может иметь любую структуру размещения I, P и B фреймов. В промышленной практике принято иметь фиксированную последовательность (вроде IBBPBBPBBPBBPBB), однако, более мощные кодеры могут оптимизировать выбор типа кадра в зависимости от контекста и глобальных характеристик видеоряда.
Каждый тип кадра имеет свои преимущества в зависимости от особенностей изображения (активность движения, временные эффекты маскирования. ).
Например, если последовательность изображений мало меняется от кадра к кадру, есть смысл кодировать больше B-фреймов, чем P. Поскольку B-фреймы не используются в дальнейшем процессе декодирования, они могут быть сжаты сильнее, без влияния на качество видеоряда в целом.
Требования конкретного приложения также влияют на выбор типа кадров: ключевые кадры, переключение каналов, индексирование программ, восстановление от ошибок и т.д.
При сжатии видео используются следующие статистические характеристики:
1. Пространственная корреляция: дискретное косинусное преобразование 8×8 точек.

2.Особенности человеческого зрения — невосприимчивость к высокочастотным составляющим: скалярное квантование коэффициентов ДКП с потерей качества.

3. Большая пространственная корреляция изображения в целом: предсказание первого низкочастотного коэффициента преобразования в блоке 8×8 (среднее значение всего блока).

4. Статистика появления синтаксических элементов в наиболее вероятном кодируемом потоке: оптимальное кодирование векторов движения, коэфициентов ДКП, типов макроблоков и пр.

5. Разряженная матрица квантованных коэффициентов ДКП: кодирование повторяющихся нулевых элементов с обозначением конца блока.

6. Пространственное маскирование: степень квантования макроблока.

7. Кодирование участков с учетом содержания сцены: степень квантования макроблока.

8. Адаптация к локальным характеристикам изображения: кодирование блоков, тип макроблока, адаптивное квантование.

9. Постоянный размер шага при адаптивном квантовании: новая степень квантования устанавливается только специальным типом макроблока и не передается по умолчанию.

10. Временная избыточность: прямые и обратные векторы движения на уровне макроблоков 16×16 точек.

11. Кодирование ошибки предсказаний макроблоков с учетом восприятия: адаптивное квантование и квантование коэффициентов преобразования.

12. Малая ошибка предсказания: для макроблока может быть сигнализированно отсутствие ошибки.

13. Тонкое кодирование ошибки предсказания на уровне макроблоков: каждый из блоков внутри макроблока может быть кодирован или пропущен.

14. Векторы движения — медленное движение фрагмента изображения со сложным рисунком: предсказание векторов движения.

15. Появления и исчезновения: прямое и обратное предсказание в B-фреймах.

16. Точность межкадрового предсказания: билинейно интерполированные (фильтрованные) разности блоков. В реальном мире движения объектов от кадра к кадру редко попадают на границы точек. Интерполяция позволяет выяснить настоящее положение объекта, зачастую увеличивая эффективность сжатия на 1 дБ.

17. Ограниченная активность движения в P-фреймах: пропущенные макроблоки. Когда вектор движения и ошибка предсказания нулевые. Пропущенные макроблоки очень желательны в кодированном потоке, поскольку не занимают битов, кроме как в заголовке следующего макроблока.

18. Компланарное движение в B-фреймах: пропущенные макроблоки. Когда вектор движения тот же, а ошибка предсказания нулевая.

Семейство форматов MPEG. Часть первая — MPEG-1.

Редакция

20 ноября 2000

История семейства форматов MPEG, к которому собственно и принадлежит стремительно набирающий в последнее время популярность формат MPEG-4, началась в далеком 1988 году. Именно в этом году был основан комитет Moving Pictures Expert Group, что на русский переводится примерно как экспертная группы кинематографии (движущихся изображений), аббревиатура которого — MPEG известна теперь любому, кто имел дело с мультимедиа — компьютерами или с цифровым телевидением. В этом же году была начата разработка формата MPEG-1, который в окончательном виде был выпущен в 1993 году. Несмотря на все очевидные недостатки этого формата, MPEG-1 по-прежнему является одним из наиболее массовых форматов видеосжатия, лишь в последнее время, начиная постепенно сдавать позиции под натиском более новых и совершенных форматов видеокомпрессии, по большей части из этого же семейства.

Надо сказать, что практически все новаторские по тем временам разработки легшие в основу формата MPEG-1, в том или ином виде встречаются и более совершенных форматах данного ряда, поэтому, рассмотрев в подробностях первого представителя этого семейства форматов видеосжатия можно получить общее представление о том, как же работают алгоритмы MPEG.

Формат MPEG-1. Старый, но еще не побежденный.

Формат MPEG-1 начал разрабатываться в те трудно вообразимые времена, когда не было широкодоступных носителей большого объема, в то время, как видеоданные, даже и сжатые, занимали совершенно колоссальные для конца 80-х объемы — средней продолжительности фильм имел размер больше гигабайта. Если кто не помнит, то это была эпоха 286 и 386 процессоров, 4 Мб оперативной памяти и 250 Мб винчестер считались роскошью, а не убогостью, как сейчас, Windows была примочкой для DOS, а не наоборот, а в качестве легко переносимых носителей информации доминировали 5 дюймовые дискеты и только-только появившиеся 3,5″ дискеты от фирмы SONY. В таких условиях необходимо было найти носитель, на который можно было бы записать гигабайт информации, при этом этот носитель должен был быть недорогим, иначе ни о какой массовости не могло быть и речи.

И такой носитель был найден. Как раз в эти годы впервые на платформе PC появился такой новый тип носителей информации как CD-ROM диски, которые смогли обеспечить необходимый объем информации. Правда, на один диск фильм в формате MPEG-1 все-таки не вмещался, но что мешало записать его на 2 CD, тем более, что новинка стоила очень недорого? Разумеется, первые CD-ROM проигрыватели были односкоростными, поэтому не стоит удивляться, что максимальная скорость пересылки потока данных (bitstream) в формате MPEG-1 ограничена 150 Кб/сек., что соответствует одной скорости CD-ROM.


Надо сказать, что возможности MPEG-1 не ограничены тем низким разрешением, которое вы все видели при просмотре VIDEO-CD. В самом формате была заложена возможность сжатия и воспроизведения видеоинформации с разрешением вплоть до 4095х4095 и частотой смены кадров до 60 Гц. Но из-за того, что поток передачи данных был ограничен 150 Кб/сек., то есть так называемый Constrained Parameters Bitstream (CPB) — зафиксированная ширина потока передачи данных, разработчики формата, а в дальнейшем и создатели кодеков на его основе, были вынуждены использовать разрешения кадра, оптимизированные под данный CPB. Наиболее широко распространенными являются два таких оптимизированных формата — это формат SIF 352х240, 30 кадров в секунду и урезанный формат PAL/SECAM 352х288, 25 кадров в секунду.

Ну вот, с разрешением определились, теперь можно и посмотреть, как это все сжимается.

Принципы Сжатия информации в MPEG-1.

В качестве примера рассмотрим урезанный формат PAL/SECAM, который более распространен, чем SIF, хотя оба эти формата за исключением разрешения и частоты смены кадров ничем друг от друга не отличаются.

Урезанная версия формата PAL/SECAM содержит 352 ppl (point per line — точек на линию), 288 lpf (line per frame — линий на кадр) и 25 fps (frame per second — кадров в секунду). Надо сказать, что полноценный стандарт PAL/SECAM имеет параметры в 4 раза большие, чем аналогичные у MPEG-1 (кроме fps). Поэтому принято говорить, что VIDEO-CD имеет четкость в четыре раза хуже, по сравнению с обычным видео.

Что касается глубины цвета, то тут не все так просто, как в компьютерной графике, где на каждый пиксел отводится определенное фиксированное число бит. MPEG-1 использует цветовую схему YСbCr, где Y — это яркостная плоскость, Сb и Cr — плоскости цветовые. Эти плоскости кодируются с разным разрешением. Существуют несколько вариантов кодирования, которые можно представить с следующем виде:

Вариант кодирования Отношение разрешений Сb/Y (Сr/Y) по горизонтали Отношение разрешений Сb/Y (Сr/Y) по вертикали
4:4:4 1:1 1:1
4:2:2 1:2 1:1
4:2:0 1:2 1:2
4:1:1 1:4 1:1
4:1:0 1:4 1:4

Как видно из таблицы Сb и Cr практически всегда кодируются с меньшим разрешением, чем Y. Чем меньше разрешение цветовых плоскостей, тем грубее и неестественнее цветопередача в видеоролике. Разумеется, самым некачественным, но и самым компактным будет последний вариант.

Перед началом кодирования происходит анализ видеоинформации, выбираются ключевые кадры, которые не будут изменяться при сжатии, а так же кадры, при кодировании которых часть информации будет удаляться. Всего выделяется три типа кадров:

  1. Кадры типа I — Intra frame. Ключевые кадры, которые сжимаются без изменений.
  2. Кадры типа P — Predirected frame. При кодировании этих кадров часть информации удаляется. При воспроизведении P кадра используется информация от предыдущих I или P кадров.
  3. Кадры типа В — Bidirectional frame. При кодировании этих кадров потери информации еще более значительны. При воспроизведении В кадра используется информация уже от двух предыдущих I или P кадров. Наличие В кадров в видеоролике — тот самый фактор, благодаря которому MPEG-1 имеет высокий коэффициент сжатия (но и не очень высокое качество).

При кодировании формируется цепочка кадров разных типов. Наиболее типичная последовательность может выглядеть следующим образом: IBBPBBPBBIBBPBBPBB. Соответственно очередь воспроизведения по номерам кадров будет выглядеть так: 1423765.

По окончании разбивки кадров на разные типы начинается процесс подготовки к кодированию.

С I кадрами процесс подготовки к кодированию происходит достаточно просто — кадр разбивается на блоки. В MPEG-1 блоки имеют размер 8х8 пикселов.

А вот для кадров типа P и B подготовка происходит гораздо сложнее. Для того, чтобы сильнее сжать кадры указанных типов используется алгоритм предсказания движения.

В качестве входной информации алгоритм предсказания движения получает блок 8х8 пикселов текущего кадра и аналогичные блоки от предыдущих кадров (I или P типа). На выходе данного алгоритма имеем следующую информацию о вышеуказанном блоке:

  1. Вектор движения текущего блока относительно предыдущих
  2. Разницу между текущим и предыдущими блоками, которая собственно и будет подвергаться дальнейшему кодированию.

Вся избыточная информация подлежит удалению, благодаря чему и достигается столь высокий коэффициент сжатия, невозможный при сжатии без потерь.

Но у алгоритма предсказания движения есть ограничения. Зачастую в фильмах бывают статические сцены, в которых движения нет или оно незначительно и возникают блоки или целые кадры, в которых невозможно использовать алгоритм предсказания движения. Думаю, вы замечали, что у видеороликов сжатых MPEG-1 качество сцен с небольшим количеством двигающихся объектов заметно выше, чем в сценах с интенсивным движением. Это объясняется тем, что в статических сценах P и B кадры, по сути, представляют собой копии I кадров, потерь практически нет, но и сжатие информации незначительно.

В случае же корректного срабатывания алгоритма предсказания движения, объемы кадров разного типа в байтах соотносятся друг с другом примерно следующим образом — I:P:B как 15:5:2. Как вы видите из данного соотношения, уменьшение объема видеоинформации налицо уже на стадии подготовки к кодированию.

По окончании этой стадии начинается собственно само кодирование. Процесс кодирования содержит в себе 3 стадии:

  1. Discrete Cosine Transformation — DTC, дискретное преобразование косинусов, преобразование Фурье.
  2. Quantization — квантование. Перевод данных из непрерывной формы в прерывистую, дискретную.
  3. Преобразование полученных блоков данных в последовательность, то есть преобразование из матричной формы в линейную.

При кодировании блоки пикселов или вычисленная разница между блоками обрабатывается первым из преобразующим алгоритмов — DTC (дискретное преобразование косинусов). Обычно пиксела в блоке и сами блоки изображения каким-то образом связаны между собой — например однотонный фон, равномерный градиент освещения, повторяющийся узор и т.д. Такая связь называется корреляцией. Алгоритм DTC, используя коррелирующие эффекты, производит преобразование блоков в частотные фурье-компоненты. При этом часть информации теряется за счет выравнивания сильно выделяющихся участков, которые не подчиняются корреляции. После этой процедуры в действие вступает алгоритм Quantization — квантование, который формирует Quantization matrix. Quantization matrix — это матрица квантования, элементами которой являются преобразованные из непрерывной в дискретную форму данные, то есть числа, которые представляют собой значения амплитуды частотных фурье-компонентов. После формирования quantization matrix происходит разбивка частотных коэффициентов на конкретное число значений. Точность частотных коэффициентов фиксирована и составляет 8 бит. После квантования многие коэффициенты в матрице обнуляются. И в качестве завершающей стадии происходит преобразование матрицы в линейную форму.

Все эти преобразования касаются только изображения. Но кроме изображения в практически любом видеофрагменте присутствует так же и звук. Кодирование звука осуществляется отдельным звуковым кодером. По мере развития формата MPEG, звуковые кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства — MPEG-1 Layer I, Layer II и Layer 3 (тот самый знаменитый MP3). Принципы кодирования всех этих кодеков основаны на психоакустической модели, которая становилась все более и более совершенной и достигла своего апофеоза для семейства MPEG-1 в алгоритмах Layer-3.

Про психоакустическую модель и принципы сжатия аудиоданных с потерями написано множество статей, в частности статья «Описание формата аудиосжатия MP3», которую вы можете прочитать на этом сайте, поэтому описание аудиокодеров можно опустить, упомянув, единственно о синхронизации аудио- и видеоданных и форматов аудиотреков.

Синхронизация аудио- и видеоданных осуществляется с помощью специально выделенного потока данных под названием System stream. Этот поток содержит встроенный таймер, который работает со скоростью 90 КГц и содержит 2 слоя — системный слой с таймером и служебной информацией для синхронизации кадров с аудиотреком и компрессионный слой с видео- и аудиопотоками.

Под служебной информацией понимаются несколько видов меток, наиболее важными из которых являются метки SCR (System Clock Reference) — инкремент увеличения временного счетчика кодека и PDS (Presentation Data Stamp) — метка начала воспроизведения видеокадра или аудиофрейма.

Ну вот рассказ о MPEG-1 практически подошел к концу, осталось лишь назвать некоторые параметры аудиотреков, которые используются в этом формате.

Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах — от высококачественных до безобразных. Окончательно все форматы сжатия аудиоданных были стандартизированы в 1992 году европейской комиссией по стандартам ISO.

В зависимости от используемого кодера и степени сжатия аудиоинформация видеоролика может быть представлена в следующем виде: моно, dual mono, стерео, интенсивное стерео (стереосигналы, чьи частоты превышают 2 КГц объединяются в моно), m/s стерео (один канал — сумма сигналов, другой — разница) и по частоте дискретизации могут быть: 48, 44.1и 32 КГц.

На этом хватит о MPEG-1, а в следующих главах речь пойдет о его более чем достойных и перспективных наследниках.


MPEG, Motion Picture Experts Group file interchange format (.mpeg)

Формат файлов MPEG Video

Разница между форматами MPEG и MPG совсем небольшая. MPEG — более новый формат, который представлен следующими подтипами: MPEG-1 — MPEG-4, MPEG-7 и MPEG-21. Сжатие с определенными потерями позволяет облегчить загрузку и выгрузку файлов, а также уменьшить размеры файлов при одновременном обеспечении высокого их качества. Эти файлы-контейнеры аудио- и видеоданных позволяют синхронизировать оба потока данных. Большое кол-во сервисов он-лайн стриминга используют файлы MPEG-1 для трансляции аудио, а также аудио/видеосигнала по кабельным сетям и через спутники. Система MPEG стала основой для создания файлов MP3. ОС Mac и Windows могут работать с файлами MPEG-1 и MPEG-2 с помощью различных программ, которые поддерживают такие форматы.

Технические сведения о файлах MPEG

Формат MPEG-1 кодирует видео и связанный с ним звук для последующего хранения с битрейтом в 1.5 Mб/с (ISO/IEC 11172) (при этом формат способен обеспечить и более высокий битрейт). Это позволяет кодировать файлы в форматы, по качеству близкие к качеству компакт-дисков иди не очень качественных дисков DVD. Формат MPEG-2 используется для телевещания с высоким разрешением. MPEG-3 используется в качестве стандарта масштабируемого сжатия с различными разрешениями для стандарта HDTV (позже этот формат был объединен с форматом MPEG-2 из-за практически полного отсутствия различий с последним). Формат MPEG-4 позволяет получить более высокой степени сжатия (по сравнению с MPEG-2), а также добиться более качественного сжатия с помощью соответствующих методов. В конце концов этот стандарт стали использовать для показа компьютерной графики. Формат MPEG-7 описан в стандарте ISO-IEV 15938, а формат MPEG-21 — в стандарте ISO/IEC 21000. При этом такие стандарты определяют общие принципы формирования медиаданных, а также предусматривают наличие авторских прав.

Основы электроакустики

Методы сжатия данных используют математические алгоритмы для устранения, группировки и/или усреднения схожих данных, присутствующих в видеосигнале. Выбор конкретного алгоритма зависит от вашей конечной цели. Существует большое разнообразие алгоритмов сжатия, включая

но только Motion JPEG (Joint Photographic Experts Group), MPEG-1 и MPEG-2 . признаны международными стандартами для сжатия видео

Методы компрессии видео изображения.

MotionJPEG предcтавляет видео как последовательность JPEG кадров. MotionJPEG один из основных стандартов, используемых в сетевых видео системах. Сетевая видеокамера, подобно цифровому фотоаппарату, обрабатывает отдельные изображения, сжимая их в формат JPEG. Сетевая камера может обрабатывать несколько кадров в течении одной секунды (Axis 221 до 60 кадров в секунду), а затем, создав непрерывный поток, транслировать их в сеть. При скорости 16 кдр/сек и выше, человеческий глаз воспринимает поток образов как непрерывное видео. Поскольку MotionJPEG представляет собой поток отдельных JPEG картинок, его можно сравнить с кинопленкой — каждый кадр имеет четкое изображение, качество которого определяется только уровнем сжатия, выбранным для отдельной сетевой видеокамеры или видео сервера.
H.263 – формат сжатия предназначенный для передачи видео с постоянной, фиксированной скоростью. Основным недостатком фиксированной скорости является то, что при движении объекта качество изображения падает. H.263 был разработан для видео конференц-связи, а не для наблюдения, где отображение деталей являются более критичным, чем скорость передачи данных.
MPEG Основы разработки стандарта MPEG были заложены группой ученых из MPEG (Motion Picture Experts Group) еще в 80х годах прошлого века. Основной принцип MPEG сжатия это сравнение двух последовательных образов и передача по сети только небольшого количества кадров (так называемые I-frame или ключевые кадры), содержащих полную информацию об изображении. Остальные кадры (промежуточные кадры, P-frame) содержат только отличия этого кадра от предыдущего. Иногда применяют двунаправленные кадры (B-frame), информация в которых кодируется на основании предыдущего и последующего кадров, что позволяет дополнительно повысить степень сжатия видео. Во всех форматах MPEG используетсят метод компенсации движения.
Несмотря на большую сложность при кодировании/декодировании видео сигнала, MPEG сжатие позволяет значительно снизить (в разы) объемы передаваемой по сети информации по сравнению с MotionJPEG.
Основа кодирования у группы алгоритмов MPEG общая. Основные идеи, применяемые в ходе сжатия видеоданных с ее помощью, следующие:

  • — устранение временной избыточности видео, учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.
  • — устранение пространственной избыточности изображений путем подавления мелких деталей сцены, несущественных для визуального восприятия человеком.
  • — использование более низкого цветового разрешения при yuv-предеставлении изображений (y — яркость, u и v — цветоразностные сигналы) — установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.
  • — повышение информационной плотности результирующего цифрового потока путем выбора оптимального математического кода для его описания (например, использование более коротких кодовых слов для наиболее часто повторяемых значений).
  • На данный момент существует три стандарта MPEG для передачи видео информации.

MPEG-1 был стандартизован и начал использоваться в 1993. Он был предназначен сжатия и хранения видео на компакт дисках. Большинство кодирующих устройств MPEG-1 и декодеров разработаны для скорости передачи данных порядка 1.5Mbit/s при разрешении CIF. Основной упор при его разработке делался на сохранении постоянной скорости передачи, при переменном качестве видео изображения, сравнимым с качеством VHS. При кодировании используется дискретно-косинусное преобразование — выполняется апроксимация внутри блока 8х8 пикселей волновыми функциями. Скорость передачи видео изображения в MPEG-1 ограничена 25 кадрами в секунду в стандарте PAL и 30 в NTSC. В данный момент этот стандарт практически не используется.
MPEG-2 был принят в качестве стандарта в 1994 для применения в высококачественном цифровом видео (DVD), цифровом телевидении высокого качества (HDTV), интерактивных носителях информации (ISM), цифровом радиовещательном видео (DBV) и кабельном телевидении (CATV). При разработке MPEG-2 усилия были сосредоточены на расширении техники сжатия MPEG-1, позволяющей обрабатывать большие изображения с более высоким качеством при более низкой степени сжатия и более высокой скорости побитной передачи данных. . Так же, как и в MPEG-1 при кодировании используется дискретно-косинусное преобразование, но обрабатываемые блоки увеличены в 4 раза — 16х16 пикселей. Скорость передачи видео изображения ограничена 25 кадрами в секунду в стандарте PAL и 30 в NTSC, так же, как в MPEG-1.
MPEG-4 – дальнейшее развитие стандарта MPEG-2. Основы разработки стандарта MPEG-4 были заложены группой ученых из MPEG еще в 1993 году, и уже к концу 1998 года произошло утверждение первого стандарта. Впоследствии стандарт неоднократно дорабатывался, в 1999 году получил официальный статус и затем был стандартизован со стороны ISO/IEC.
Целью создания MPEG-4 была выработка стандарта кодирования, который обеспечил бы разработчиков универсальным средством сжатия видеоданных, позволяющим обрабатывать аудио- и видеоданные как естественного (снятого с помощью видеокамеры или записанного с помощью микрофона), так и искусственного (синтезированного или сгенерированного на компьютере) происхождения. Это обстоятельство кардинальным образом отличает MPEG-4 как видеостандарт от его предшественников MPEG-1 и MPEG-2, в которых эффективное сжатие данных достигается лишь применительно к естественному видео и аудио.
MPEG-4 обеспечивает необходимые средства для описания взаимного расположения объектов (элементов) сцены в пространстве и времени с целью их последующего представления потенциальным зрителям в ходе воспроизведения. Разумеется, такая трактовка предполагает разделение сцены на составляющие ее объекты, что само по себе является весьма трудоемкой задачей, к которой по сути и сводится MPEG-4-кодирование. Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения объектов сцены в различных условиях пропускной способности сетей передачи данных. Был разработан формат, допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях. Другими словами, один и тот же видеофрагмент может быть представлен с различным качеством для различных каналов в зависимости от их пропускной способности.

Перспективные технологии — Advanced Video Coding (Расширенное кодирование видео данных)
В последнее время, описанные выше форматы сжатия H.263 и MPEG, начинают объединять, беря из них самое лучшее и передовое, для создания нового стандарта сжатия видео следующего поколения. Ожидается, что в течении ближайших нескольких лет, появится новый, более прогрессивный, стандарт сжатия потокового видео, который заменит используемые в настоящее время H.263 и MPEG-4.

Преимущества и недостатки форматов Motion-JPEG, MPEG-2, MPEG-4
Благодаря простоте, стандарт Motion-JPEG широко используется во многих системах и зачастую является удачным выбором для решения задач видеонаблюдения. При его использовании задержка между получением и кодированием изображения в камере, передачей его по сети, декодированием и отображении на экране монитора незначительна. Другими словами, из-за своей простоты, Motion-JPEG обеспечивает минимальное время задержки между реальным событием и его цифровым отображением, что позволяет оперативно обрабатывать изображение, например используя детектор движения, и отслеживать движущиеся объекты. При использовании формата Motion-JPEG возможна передача изображения с любым разрешением, начиная от самого минимального QVGA для мобильного телефона, до разрешения в несколько мегапикселов. Он гарантирует качество изображения не зависимо от его сложности и количества/размера движущихся объектов, предлагая пользователю выбрать наиболее оптимальные параметры, подходящие для его системы – высокое качество изображения (низкое сжатие) или более низкое качество (высокое сжатие) и меньшие размеры файла, позволяющие снизить нагрузку на сеть и уменьшить размеры дискового пространства, необходимые для хранения видео информации. Скорость передачи кадров может быть установлена принудительно и подстраивается автоматически под имеющуюся полосу пропускания без потери качества изображения.
Однако при компрессии Motion-JPEG не используются алгоритмы видео сжатия, это производит к относительно большим объемам данных, передающихся по сети. В этом отношении, форматы MPEG имеют преимущество по сравнению с M-JPEG, т.к. по сети за единицу времени передается меньший объем информации (более низкий bit-rate). Если существуют ограничения по полосе пропускания, если видео должно записываться с большой скоростью и есть ограничения по размеру дискового пространства – выбор MPEG сжатия может оказаться единственно возможным. Он обеспечивает относительно высокое качество изображения при более низкой нагрузке на транспортную магистраль (требуется меньшая полоса пропускания), по сравнению с Motion-JPEG в 2.5 – 7 раз. Однако это достигается за счет более сложных алгоритмов кодирования/декодирования, требующих большего времени на обработку видео, что приводит к значительным задержкам (до 3-4 секунд) между реальным событием и отображением его на экране.
Следует иметь в виду, что стандарты MPEG-2 и MPEG-4 является лицензируемыми. При их использовании необходимо приобретать лицензии на их использование. Для российского рынка это в теории.
График показывает зависимость полосы пропускания от скорости передачи кадров для Motion-JPEG и MPEG-4. Очевидно, что при низких скоростях MPEG-4 не дает выигрыша, т.к. несуществующие кадры «заполняются» аппроксимированной информацией смежных изображений. При больших значениях скорости передачи кадров, для MPEG-4 требуется значительно меньшая полоса пропускания чем для Motion-JPEG.

Выводы В большинстве приложений используется формат сжатия Motion-JPEG, позволяющий найти компромисс между качеством и скоростью передачи видео изображения. MPEG-4 позволяет экономить дисковое пространство и менее требователен к размеру полосы пропускания, но предъявляет повышенные требования к ресурсам рабочей станции, обрабатывающей видео поток. В случаях, когда нужно только записывать или просматривать видео, MPEG-4 идеальный выбор, но если необходимо анализировать изображение предпочтение стоит отдать Motion-JPEG.

Базовые принципы сокращения избыточных
видео-данных в процессе MPEG-кодирования.

В процессе MPEG кодирования устраняются избыточные видеоданные в серии рядом расположенных кадров.

Два соседних кадра обычно содержат много одинаковых элементов изображения. Информация в них отличается на малую часть от всей информации содержащейся в кадре. Производится сжатие видео, при котором используются не все данные каждого видеокадра, а динамика изменений кадров, так как в большинстве последовательных кадров одного видео-сюжета фон почти не изменяется, а хорошо заметные изменения происходят на переднем плане.

Например, происходит плавное перемещение небольшого объекта на фоне неизменного заднего плана. В этом случае полная информация о изображении сохраняется только для опорных изображений. Для остальных кадров оцифровывается только разностная информация: о положении объекта, направлении и величине его смещения, о новых элементах фона, открывающихся за объектом по мере его движения. Причем эта разностная информация вычисляется не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается ранее скрытая часть фона).

Процесс сокращения данных производится следующим образом. Прежде всего создается опорный кадр (I, Intra frame).

Опорные I-кадры используются для восстановлении остальных кадров и размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты кадров, которые находятся между I-кадрами, успевают измениться, и именно эти изменения фиксируются в процессе сжатия.

Кроме I-кадров, в MPEG различают еще два типа кадров:

  • предсказуемые кадры (P, Predicted), содержащие разность текущего изображения с предыдущим I кадром или с учетом смещений отдельных фрагментов;
  • двунаправленные предсказуемые кадры (B, B > I-кадры составляют основу MPEG потока и через них осуществляется случайный доступ к какому-либо отрывку видео. Сами I-кадры для обеспечения визуально высокого качества сжимаются незначительно.

P-кадры кодируются относительно предыдущих кадров (I или P) и используются как сравнительный образец для дальнейшей последовательности P-кадров. В этом случае достигается высокий уровень сжатия.

B-кадры кодируются с высокой степенью сжатия. Для привязки B-кадров к видеопоследовательности необходимо использовать не только предыдущее, но и последующее изображение. B-кадры никогда не используются для сравнения.

I, P, B кадры объединяются в группы (GOP- Group Of Pictures), представляющие собой минимальный повторяемый набор последовательных кадров, например:

(I0 B1 B2 P3 B4 B5 P6 B7 B8 P9 B10 B11) (I12 B13 B14 P15 B16 B17 P18 . )

Кадры состоят из макроблоков, представляющих собой небольшие фрагменты изображения размером 16 × 16 пикселов. Процессор MPEG-энкодера анализирует кадры и ищет идентичные или очень близкие макроблоки, сравнивая базовый и последующие кадры. В результате сохраняются только данные о различиях между кадрами, называемые вектором смещения (vector movement code). Макроблоки, которые не содержат изменений, игнорируются, и количество данных для передачи, таким образом, значительно снижается. Для снижения влияния ошибок при передаче данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices). В свою очередь каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости (Y), а остальные 2 блока несут информацию цветоразностных сигналов (U/V). Блоки являются базовыми единицами, над которыми осуществляются основные математические операции кодирования, например, дискретно-косинусное преобразование.

Используются схемы блоков 4:2:0 или для студийного (вещательного) качества 4:2:2.


Это важный момент, требующий более подробного пояснения:

Полезно знать, что полученные от видеокамеры цветовые RGB данные, могут быть эквивалентно представлены как сумма яркостного сигнала (Y) и двух цветоразностных сигналов (U и V), называемых хроматическими. Яркостной сигнал Y определяет яркость точки. Цветоразностные сигналы U и V вместе с Y-сигналом позволяют полностью восстановить исходные RGB данные.

Y вычисляется из RGB данных по формуле: Y = 0.299R + 0.587G + 0.114B

U и V сигналы вычисляются так: U = R — Y, а V = B – Y

При приёме сигнала происходит обратный процесс:

RGB данные вычисляются так: R = Y + U; B = Y + V; G = Y — 0.509U — 0.194V

Известно, что информация хроматических данных может быть сокращена в большей степени, чем яркостная информация, без видимого ущерба для качества восприятия изображения человеком.

Для видео стандартного разрешения используется рекомендация 601 [3] CCIR, определяющая — как компонентный (YUV) видео сигнал может быть оцифрован, чтобы сформировать дискретные пикселы.

Специалистами часто используются термины формат 4:2:2 и формат 4:2:0, чтобы описать структуру осуществления выборки цифрового изображения:

— формат 4:2:2 означает, что частота горизонтальных выборок хроматических данных сокращена в два раза по сравнению с яркостными данными;

— формат 4:2:0 означает, что частота как горизонтальных так и вертикальных выборок хроматических данных сокращена в два раза по сравнению с яркостными данными.

Согласно рекомендации 601 CCIR, активная область оцифрованного телевизионного кадра (SD) представлена 576 линиями по 720 пикселей в каждой, с частотой кадров 25 гц. При использовании по 8 битов для записи значения каждого из яростных и хроматических параметров (Y, U/V), полный размер потока оцифрованного некомпрессированного видео будет следующим для схем 4:2:2 и 4:2:0:

Для 4:2:2 720 × 576 × 25 × 8 + 360 × 576 × 25 × (8 + 8) = 166 Мб/с

Для 4:2:0 720 × 576 × 25 × 8 + 360 × 288 × 25 × (8 + 8) = 124 Мб/с

В то же время, видео сжатое MPEG 2-кодером до потока всего 5-6 Мб/с визуально воспринимается как совершенное высококачественное изображение.

Таким образом MPEG кодеры сокращают следующие видео данные:

  • сокращается временная избыточность (кодируется только разностная информация).
  • сокращается пространственная избыточность путем исключения мелких деталей там где при просмотре сюжета это визуально не заметно.
  • сокращается незначащая часть данных цветности.

Кроме сокращения данных в процессе MPEG кодирования повышается информационная плотность результирующего цифрового потока путем использования эффективного математического кода для его описания.

СОВЕТЫ ПОЛЬЗОВАТЕЛЮ. НА ЗАМЕТКУ

Все что нужно знать о видео кодеках и контейнерах

Сегодня, кажется, все стремятся стать кинематографистами. Люди используют для видеосъемки самые различные гаджеты и девайсы, включая мобильные телефоны, цифровые фотокамеры, портативные и профессиональные видеокамеры. А последнее поколение цифровых зеркальных фотокамер позволяет записывать видео с поддержкой высокого разрешения.

Чтобы научиться снимать хорошее видео, потребуется приложить определенные усилия, но все становится еще более сложным, когда вы захотите во всей красе продемонстрировать свой шедевр другим людям. Может быть, вам нужно загрузить его на YouTube, может вы собираетесь записать свой Blu-ray или DVD диск, возможно, захотите загрузить видео на мобильный телефон или планшетный компьютер.

Разобраться в том, какой кодек и контейнер лучше подойдет для создания вашего видеошедевра порой достаточно сложно. Помочь в решении этой проблемы сможет представленный далее материал.

Какая разница между кодеком и контейнером?

Начинающие пользователи часто бывают озадачены, когда пытаются выяснить разницу между кодеками и контейнерами. Сейчас слово Кодек стало чем-то общеупотребительным, а изначально термин являлся сокращением от понятия КОмпрессор-ДЕКомпрессор. Что же делают кодеки?

Они принимают цифровые медиа данные и либо сжимают их (для передачи и хранения), либо распаковывают для просмотра и перекодирования. Каждый кодек использует определенный метод кодирования и декодирования цифровых данных.

Увеличить фото

Несжатое (англ. raw означает необработанное или часто говорят « сырое») видео и аудио требует для хранения огромного дискового пространства. Несжатое видео высокой четкости формата 1080i, записываемое со скоростью 50 кадров в секунду, съедает до 410 гигабайт в час. Аудио с CD дисков, довольно устаревшее по современным стандартам, звучит около 74 минут при емкости диска 680 мегабайт. Однако, восьмиканальный звук, кодируемый с 24 битным разрешением, потребует уже 16 мегабит в секунду, или несколько гигабайт в час. Даже возможностей широкополосного соединения с интернет порой не хватит, чтобы послушать музыку в полном аудио разрешении. Вот почему цифровые видео и аудио записи должны быть сжаты для передачи и хранения.

После того как медиа данные ужаты в разумные пределы, они должны быть упакованы для транспортировки и последующего отображения. Для этого используются форматы-контейнеры, выполняющие роль «черного ящика», наполняемого различными медиа-форматами. Хорошие форматы контейнеров могут вмещать файлы, сжатые разными кодеками.

Давайте разберемся с типами кодеков.


Общее понятие о кодеках

Если вы пообщаетесь с людьми, которые занимаются видеообработкой или посетите соответствующие веб форумы, то будете, так или иначе, причастны к, порой бурным, дебатам о том, какой кодек лучше. В действительности, эффективность любого кодека во многом зависит от используемого режима сжатия и типа обрабатываемых видеоматериалов. Так что стоит рассматривать различные кодеки и с учетом их конкретного использования и особенностей сжимаемого материала. Далее в основном рассматриваются видео кодеки, но в разделе, посвященном контейнерам форматов, упоминается и об использовании аудиокодеков.

Ввод и архивирование видео

Большинство устройств современной бытовой электроники получает контент в каком-либо уже сжатом формате. Как правило, только профессиональные видеооператоры работают с несжатым HD видео. Конечно в идеале, если это возможно, при наличии очень емкой системы хранения, видеоархивы нужно хранить в оригинальном формате съемки, потому что при этом обеспечивается максимальное качество. Перекодировка видео из одного типа сжатия в другой может привнести едва различимые искажения, которые могут снизить качество изображения. (Подобные погрешности минимизирует хорошее программное транскодирование.) Сегодня предлагается множество кодеков, с определенной специализацией. С большинством из них обычный пользователь может никогда и не столкнуться. Следующий раздел посвящен кодекам, как системам сжатия/декомпрессии, используемым в составе специального программного обеспечения, которое позволяет кодировать или перекодировать видеофайлы.

x.264/ MPEG-4 AVC (Advanced Video Coding). Этот наиболее распространенный кодек используется в современных цифровых видео- и фотокамерах, в которых результаты съемки сохраняются в виде файлов на встроенных жестких дисках, картах памяти, и т.д.

MJPEG (Motion JPEG). Это более старый формат, используемый некоторыми цифровыми камерами и видеотехникой прежнего поколения. Он был разработан теми же специалистами (Joint Picture Experts Group), которые занимались еще ранее разработкой кодека JPEG для сжатия обычных статичных изображений, отсюда и название этого кодека.

DV и HDV. Стандарт DV был разработан консорциумом компаний производителей видеотехники для ленточных систем хранения информации и часто использовался в видеокамерах со слотом для ленточных мини кассет. Некоторые версии DV успешно использовались в профессиональных видеокамерах, была разработана версия HDV для поддержки высокого разрешения с ленточными кассетами.

Перейдем к устаревающим уже DVD или чуть более модным Blu-ray дискам. Несмотря на растущую популярность потокового видео, возможность передачи медиа данных с помощью дисков в обозримом будущем по-прежнему будет востребована. Записанные на диски материалы спокойно можно передавать там, где нет каналов связи и смотреть везде, даже там, где нет возможности подключиться к интернету.

MPEG-2. Необходимо различать кодек MPEG-2, также известный как x.262, от формата контейнера MPEG-2. MPEG-2 используется для сжатия видео на дисках DVD и сигналов телевидения высокой четкости (DVB), передаваемого по эфирным каналам. Первоначально MPEG-2 применяли и для сжатия на Blu-ray дисках, хотя большинство современных Blu-ray фильмов не используют MPEG-2.

x.264/MPEG-4 AVC. x.264используется при сжатии видео для Blu-ray дисков. По сути это тот же кодек, который применяется для сжатия видео в современных видеокамерах. Данный метод очень масштабируемый и при высоком битрейте сжатое по стандарту x.264видео выглядит просто фантастически.

Microsoft VC-1. Microsoft VC-1 включает три разных по степени сжатия кодека. VC-1 Advanced Profile, также известный как Windows Media Video 9 Advanced Profile или просто WVC1 является одним из трех кодеков, применяемых для кодирования содержимого Blu-ray дисков. VC-1 в качестве альтернативы технологии Adobe Flash используется в интернет-платформе Microsoft Silverlight.

Потоковое и веб видео

Передача видео через интернет обязательно подразумевает компромиссы, в основном между качеством изображения и скоростью передачи данных, которая сегодня и ограничивает максимально достижимое качество. Скорость передачи или, как еще говорят, ширина канала во многом зависит от возможностей интернет-провайдера и используемой им технологии доставки сигнала в вашу квартиру.

MPEG-1. Это старый боевой конь для доставки видео в сети интернет. Хотя YouTube, Netflix, и другие поставщики относительно качественного потокового видео уже отказались от MPEG-1, масса видео стандартного разрешения на базе MPEG-1 все еще доступна на других сайтах.

WMV (Windows Media Video): Есть Windows Media Video кодек и контейнерный формат файла. Хотя, этот метод сжатия был и не так используем, как MPEG-1, в сети все еще есть много WMV контента. Но при создании своих видеоматериалов, его очевидно также не стоит применять.

x.264/ MPEG-4 AVC. x.264 обеспечивает при относительно низкой скорости передачи, достаточно высокое качество видео. x.264, вероятно, становится наиболее распространенным кодеком. Adobe поддерживает его во Flash, x.264может использоваться с изображениями HTML 5, на x.264ориентируется YouTube и Apple полностью поддерживает этот метод компрессии. Однако при создании видео сжатого в форматах x.264вы не сможете воспроизводить их на старых устройствах, это ставка на будущее.

Правильный контейнер: гибкий и удобный

Далее кратко рассмотрены наиболее распространенные сегодня контейнерные форматы медиафайлов. У каждого из них есть свои достоинства и недостатки. Выбор зависит от предполагаемой задачи. Контейнерные файлы, кроме сжатого видео, вмещают и цифровой звук, сжатый соответствующими аудио кодеками, а также меню и дополнительную информацию.

Контейнеры для архивирования и ввода

Также, как и с кодеками, Вы должны выбрать контейнерный формат для хранения сжатого видео с максимально возможным в ваших условиях качеством. Для большинства пользователей нужен просто способ сохранить свое видео, для того чтобы затем передавать его в потоковом виде по домашней сети или даже через интернет, но при этом никто не хочет видеть впоследствии на экране пиксельную структуру и смазанное изображение. Правильный контейнер поможет сохранить баланс между качеством и потоковыми возможностями.

Advanced Systems Format (ASF) – разработанный Microsoft контейнерный формат. Встречается несколько расширений, включая .asf, .wma и.wmv. Отметьте, что файл с расширением .wmv, вероятно, сжат кодеком WMV (Windows Media Video), но сам файл помещен в контейнерный файл ASF. Файлы ASF, в теории, могут содержать видео и аудио файлы, сжатые любым кодеком. Однако, практически воспроизведение иногда может стать проблемным, особенно с видео, сжатым кодеками x.264. Если вы планируете пользоваться продуктами Microsoft, ASF прекрасный выбор, но могут быть проблемы с медиа файлами на основе иных кодеков.

Audio Video Interleave (AVI) – один из более старых контейнерных форматов Microsoft. Вероятно, его уже не стоит использовать в новых проектах.

QuickTime: компания Apple продвигает собственный контейнерный формат QuickTime, который поддерживает множество кодеков для аудио и видео. Apple — убежденный сторонник x.264, таким образом, файлы QuickTime (.mov, .qt) могут содержать видео, сжатое кодеком x.264.

MP4. Этот контейнерный формат разработан Motion Pictures Expert Group, известен также как MPEG-4, часть 14. Видео внутри файлов MP4 кодируется кодеком x.264, а аудио – кодеком AAC, но могут использоваться и другие стандарты сжатия звука.

VOB и BDAV MPEG-2. Эти контейнерные форматы используются для упаковки данных на DVD и Blu-ray дисках, соответственно. В файлах Blu-ray дисков (.m2ts) могут содержаться видеозаписи сжатые кодеками x.264и VC-1, звук может быть сжат одним из кодеков Dolby или использоваться несжатый многоканальный сигнал в формате PCM.

AVCHD: Этот стандарт контейнера применен во многих видеокамерах. Снимаемое видео предварительно сжимается кодеком x.264. Аудиосигнал для контейнера кодируется кодеком Dolby Digital (AC3) или используется несжатый – PCM.

Flash: Компания Adobe имеет собственный контейнерный формат Flash, который поддерживает множество кодеков. Большая часть недавно созданного Flash видео кодирована с использование видеокодека x.264и аудиокодека AAC, но не стоит ожидать, что на всех сайтах используются только эти кодеки, особенно для ранее созданного видео.

Прочие контейнеры: Среди прочих форматов контейнеров, широко используемых особенно для доставки видео через интернет, можно упомянуть популярный во многом за счет своей универсальности и открытого кода формат Matroska (.mkv, .mk3d, .mka, .mks), а также OGG и DiVX. Файлы с расширением .divx вмещают видео, ужатое одноименным кодеком с пиратской родословной, который позволяет получить достаточно высокое качество видео при эффективной компрессии видеоматериалов. Долгое время Divx официально не признавался и его использование не приветствовалось. Однако сегодня многие известные производители уже встраивают аппаратные кодеки DiVX в свою видеотехнику.

Какой кодек и контейнер выбрать

Увеличить фото

Если вы будете размещать свое видео на домашнем сервере, с тем чтобы впоследствии смотреть его на экране телевизора, подключаемого непосредственно к сети или через медиаплеер, необходимо выяснить какие форматы распознают телевизор и плеер. Практически всеми устройствами поддерживается сегодня кодирование в соответствии со стандартом MPEG-2, но в этом случае потребуется достаточно большой объем для хранения видео в HD разрешении. Очевидно, наиболее подходящим в ближайшем будущем можно считать различные варианты кодека x.264, в котором реализован алгоритм сжатия, поддерживаемый всеми популярными контейнерами.


Если больше интересует воспроизведение готового видео, и вы планирует нарезать (ripping) фильмы из своей персональной коллекции DVD дисков для передачи по домашней сети, вас может устроить контейнер MP4, как удачный компромисс между степенью сжатия и качеством.

All-Audio.pro

Статьи, Схемы, Справочники

Что такое mpeg

MPEG англ. Первое собрание группы состоялось в мае года в Оттаве [1] [2] [3]. К году в собраниях участвовало до человек. Основатель и бессменный председатель комитета — д-р Леонардо Кьярильоне итал. В дополнение к вышеупомянутым, существуют стандарты, которые являются не усовершенствованием предыдущих стандартов сжатия, а определяют различные языки описания:. Материал из Википедии — свободной энциклопедии.

Поиск данных по Вашему запросу:

Дождитесь окончания поиска во всех базах.
По завершению появится ссылка для доступа к найденным материалам.

Перейти к результатам поиска >>>

Преимущества MPEG-4 AVC (h.264) перед MPEG-2

Стандарт MPEG-4 в основном используется для вещания потоковое видео , записи фильмов на компакт-диск и в видеотелефонии видеотелефон и широковещании, в которых активно используется сжатие цифровых видео и звука. MPEG-4 делится на несколько частей. MPEG-4 предоставляет комплект технологий для разработчиков, для различных поставщиков услуг и для конечных пользователей. MPEG-4 использует объектное представление мультимедиа-данных, в котором в роли объектов могут выступать как фрагменты видео и аудио данных, так и статичные изображения, двух- и трёхмерные объекты и текст.

Это основное отличие стандарта от его предшественника MPEG-2 , который представляет собой совокупность техник сжатия видео- и аудиоданных. Некоторые из них являются отдельными стандартами или идентичны другим существующим например, часть Список частей включает следующие:.

Также внутри частей определены профили стандартов, поэтому реализация какой-либо части стандарта ещё не означает полной поддержки этой части.

В MPEG-4 содержатся патентованные технологии, которые требуют лицензирования в странах, признающих патенты на программное обеспечение. Патенты, покрывающие MPEG-4, принадлежат двум десяткам компаний. Осуществить лицензирование за один шаг сейчас невозможно.

Wikimedia Foundation. MPEG-7 — is a multimedia content description standard. MPEG — англ. We are using cookies for the best presentation of our site.

Continuing to use this site, you agree with this. Толкование Перевод. Standards in Practice , Angelides Marios C.. Экспорт словарей на сайты , сделанные на PHP,. Пометить текст и поделиться Искать во всех словарях Искать в переводах Искать в Интернете.

Преобразование MPEG в текст с помощью Sonix

Наверное, вы уже знаете что такое объёмный звук, например, в домашнем кинотеатре или в настоящем кинотеатре, это когда вокруг зрителя располагаются множество колонок, каждая из которых воспроизводит свой звук, мы его слышим по-разному из каждой колонки и в нашей голове выстраивается довольно убедительное впечатление того, что звук вокруг нас, что он звучит ото всюду, а не только из конкретных колонок. На выставке CES был представлен новый формат хранения и передачи звука, который называется MPEG-H и разработали его в том самом знаменитом институте Фраунгофера , в котором много лет назад был разработан формат хранения и обработки звука MP3. В настоящее время, если вы хотите дома установить систему многоканального объёмного звука, вы воспользуетесь форматом 5. Этот подход хорош тем, что у вас действительно будут установлены физические источники звука вокруг вас, а значит, вы будете слышать звук оттуда, откуда он на самом деле исходит.

MPEG – Видео-файл MPEG (MPEG Movie)

Зарегистрируйтесь на бесплатную пробную учетную запись Sonix —включает в себя 30 минут преобразования свободной речи в текст. Sonix автоматически извлекает аудио из файла MPEG и преобразует его в текст. Это займет всего несколько минут, чтобы вы могли выпить кофе. Используйте редактор аудиотекста Sonix для полировки стенограммы. Просто введите в браузере, чтобы исправить любые слова. Вот так! Ваш файл MPEG преобразован в текст! Using MPEG compression, a multimedia file will be significantly smaller with little noticeable loss in quality. This makes transferring files over the Internet more efficient, which helps conserve Internet bandwidth.

Что значит MPEG

За приобретением оборудования обращайтесь к нашим партнерам, ссылки которых расположены ниже. Свежая информация. Поиск по сайту. MPEG — это просто! Материал опубликован в журнале «», номер 3,

Транспортный поток MPEG TS: основные понятия

Единый стандарт станет полезным для контент-производителей, которым будет достаточно создавать файлы одного типа, которые без каких-либо трудностей будут проигрываться на всех DASH-совместимых устройствах. И хотя от Adobe и Apple пока еще не было подобных заявлений, поддержка со стороны этих двух компаний окажет положительное влияние на будущее этого стандарта на рынке вещания. Это значит, что DASH-пользователям придется осуществлять мультипотоковую передачу, задействовав несколько кодеков, что увеличит затраты на кодирование и хранение информации. Также вырастут и административные расходы. И наконец, остается неясным вопрос, будет ли DASH-стандарт платным или абсолютно бесплатным? Ответ на этот вопрос может повлиять на большинство потенциальных пользователей стандарта.

MPEG для чайников.

Своей известностью и плохой репутации DivX должен быть благодарен пиратам и Интернет. Благодаря этому революционному формату фильмы могут распространяться через Сеть, а двухчасовая видеопрограмма в хорошем качестве легко поместится на стандартный CD. Однако, наша статья о том, что DivX используют отнюдь не только пираты. И также как в свое время MP3 нашел себе место в индустрии мобильных развлечений и устройствах домашней электроники, DivX начинает прокладывать свой не менее успешный путь в этом направлении. DivX — это синоним мобильных и стационарных приложений будущего в области цифрового видео. Формат признали известные производители — технологические лидеры. Сейчас идет его активное внедрение в электронные устройства — от стационарных DVD-проигрывателей до мобильных телефонов, от устройств цифрового телевидения до карманных ПК.

MPEG-4 и MP4: в чем разница между MPEG-4 и MP4

Предлашаем Вам подписаться на ежедневную рассылку нашего портала. Запрещены любые упоминания о политике , фотографии, карикатуры, анекдоты и прочее. Сборка rpm пакета nginx с поддержкой tls 1.

MPEG — это международный стандарт для сохранения аудио- и видеофайлов небольшого размера. Стандарт получил распространение, прежде всего, в мобильных устройствах. Исходный стандарт видео и аудио компрессии. Целью при этом была запись фильмов и аудио на компакт-диски.

На самом деле они не одинаковы. Прочитав это простое введение, вы получите четкое представление об этих двух понятиях. Чтобы выяснить разницу между MP4 и MPEG-4, нам нужно сначала понять два основных термина: видеокодек и медиа-контейнер. Это может быть показано с помощью следующей формулы:. MPEG-4 — сложная вещь, которая включает в себя знания в различных аспектах. Это цифровой мультимедийный формат контейнерный формат , который используется для хранения видео, аудио, изображений и других подобных данных.

Ваш телефон:. Кого спросить:. Кратко опишите тему Вашего запроса:. В процессе MPEG кодирования устраняются избыточные видеоданные в серии рядом расположенных кадров.

Илон Маск рекомендует:  Snmp протокол принципы, безопасность, применение
Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL