Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Что из этого получилось.




Работала экспертная группа весьма плодотворно: за десятилетие разработано целое семейство стандартов; более того, почти все они живут и успешно работают. Лучшим свидетельством тому служит тот факт, что аббревиатуры MPEG и МР стали обиходными на бытовом уровне. Даже потребитель соотносит эти "имена" не со стандартными именами или их разработчиками, а с мультимедиа продукцией. Но будем хронологически точны, и проследим наиболее важные этапы становления MPEG.

MPEG1

Первый стандарт появился в 1992 г. и был рассчитан на передачу видео по низкоскоростным сетям или для записи на компакт-диски (Video-CD). Как вы, наверное, поняли, максимально возможная скорость цифрового потока была изначально ограничена порогом в 150 кб/с (односкоростной CD-ROM или стандартный аудиопроигрыватель компакт-дисков). Первые видеодиски и спутниковые телепередачи в формате MPEG1 казались чудом - фильм можно смотреть при такой низкой скорости потока! Чтобы уложится в заданные рамки, конечно, пришлось поступиться качеством. В MPEG1 разрешающая способность картинки снижена, по сравнению с разверткой вещательного телевидения, в 2 раза по обеим осям: 288 активных строк в ТВ-кадре и 360 отсчетов в активной части ТВ-строки. В принципе, это разрешение близко по уровню к формату аналоговой VHS-видеозаписи. Но нельзя забывать о JPEG-компрессии. Уменьшение числа отсчетов означает тем самым увеличение блоков и макроблоков внутри каждого кадра. То есть снижение разрешения автоматически делает внутрикадровую компрессию более грубой, и, как следствие - более заметной потребителю. Однотонные поверхности оказываются как бы соствленными из рассыпающихся квадратиков; особенно назойливо квадратики "вылезают" на динамичных сценах.
Известны случаи, когда при выпуске версий фильмов на Video-CD приходилось урезать в несколько раз многие сцены с большим количеством движения: погони, драки, взрывы и т.п. Однако повторим, что в целом качество фильмов в MPEG1 сравнимо с бытовой VHS-кассетой, и полнометражный фильм можно уместить на 2 компакт-дисках, так что в середине просмотра придется их менять. По этим причинам, а также по причине прогресса цифровых технологий стандарт MPEG1 не успел получить большего распространения. От него нам остались в основном стандарты сжатия звука, существующие сегодня самостоятельно (о них несколько слов ниже).

Справедливости ради и для полноты охвата следует упомянуть еще об одной попытке преодоления врожденных недостатков - о формате Super Video CD. В этой версии было повышено разрешение, снижена степень JPEG-компрессии (что, конечно, повысило качество картинки) и добавлена поддержка многоканального звука. Но неизбежное следствие - рост объема информации: средний фильм "распух" до 3 компакт-дисков! Для стимулирования этого формата рядом фирм были выпущены специальные плееры, оснащенные трехдисковыми чейнджерами. Но, несмотря на относительную дешевизну, формат SuperVideoCD так и не стал альтернативой DVD и получил весьма ограниченное распространение только в ряде стран Юго-Восточной Азии.

MPEG2

Время шло, и прогресс в области цифровых технологий потребовал (или позволил?) существенно усовершенствовать процесс компрессии видеоданных. Так появился новый стандарт MPEG2, работа над которым, собственно, началась сразу после выхода MPEG1 и завершилась в 1995 г.
"Второй " MPEG не принес революционных изменений, это - вполне революционная доработка старого стандарта под новые возможности техники и новые требования заказчиков - крупнейших компаний mass-media. MPEG2 предназначался для обработки видеоизображения, соизмеримого по качеству с телевизионным вещательным, при пропускной способности каналов передачи данных от 3 до 15 Мбит/с. Сейчас стандарт MPEG2 ассоциируется у подавляющего большинства читателей и зрителей с DVD-дисками. Но в 1992 г., когда стартовали работы над этим стандартом, еще не существовало широкодоступных носителей, на которые можно было бы записать видеоинформацию, сжатую по алгоритмам MPEG2. Самое главное - компьютерная техника того времени не могла обеспечить и нужную полосу пропускания. Зато спутниковое телевидение с новейшим по тем временам оборyдованием уже тогда готово было предоставить канал передачи с необходимыми характеристиками.
В октябре 1995 года через телевизионный спутник "Pan Am Sat" было реализовано первое 20-канальное цифровое ТВ-вещание, использовавшее стандарт MPEG2. Спутник осуществлял вещание на территории Скандинавии, Бенилюкса, Ближнего Востока и Северной Африки.

С появлением же в середине 90-х гг. цифрового многоцелевого диска DVD (Digital Versatile Disk, Digital Video Disk), обладающего в простейшей - односторонней и однослойной - версии емкостью 4,7 Гб (почти в 8 раз больше CD), он, естественно, становится практически безальтернативным массовым носителем для распространения качественной продукции, сжатой по стандарту MPEG2. Это обусловило массовое производство бюджетных DVD-проигрывателей и, конечно, появление недорогих аппаратных кодеров/декодеров. На стандарте MPEG2 сейчас построены все системы цифрового спутникового телевидения, в частности, система "НТВ+". На нем же основываются эфирные системы цифрового телевещания DVB, получающие все более широкое распространение в ряде стран Западной Европы и в США. В профессиональной студийной аппаратуре для реализации цифрового нелинейного монтажа используется версия EDITABLE MPEG, в которой все кадры ключевые, а скорость потока в формате 4:2:2 достигает 50 Мбит/с.

Но это лишь констатация факта. Попробуем приблизительно пояснить, в чем основные отличия MPEG2 от предшественника, сделавшие его привлекательным. Как мы отмечали, революционных изменений в новом стандарте нет, но усовершенствование коснулось практически всех этапов "упаковки"; более того, появились операции, ранее не применявшиеся. К примеру, после разбивки видеопотока на кадры и группы кадров кодер анализирует содержимое очередного кадра на предмет повторяющихся, избыточных данных. Составляется список оригинальных участков и таблица повторяющихся участков. Оригиналы сохраняются, копии удаляются, а таблица повторяющихся участков используется при декодировании сжатого видеопотока. Значительное повышение плотности упаковки было также достигнуто благодаря применению во внутрикадровом сжатии нелинейного преобразователя Фурье взамен линейного. Оптимизации подвергся алгоритм предсказания движения, а также введены несколько новых, ранее не используемых алгоритмов компрессии видеоданных. Они в совокупности позволяют кодировать разные слои кадра в зависимости от их важности с разной интенсивностью цифрового потока. Стандарт MPEG2 предоставляет программистам и "продвинутым" пользователям возможность в процессе кодирования задавать точность частотных коэффициентов матрицы квантования, что непосредственно влияет на качество получаемого в результате сжатия изображения (и на размер тоже). Точность квантования может варьироваться в диапазоне 8-11 бит на одно значение элемента. Для сравнения: в MPEG1 предусматривалось только одно фиксированное значение - 8 бит на элемент. То есть в рамках стандарта MPEG2 имеется возможность гибкой настройки качества изображения в зависимости от пропускной способности сети или емкости носителя (вот почему на первых DVD можно было видеть разное по качеству изображение). Биты на элемент - это понятие, знакомое компьютерным "юзерам". В то же время, пользователи таких аппаратов, как DVD- или HD-рекордеры, использующих MPEG2-компрессию, знают, как можно самим задавать уровень качества записи (HQ, SP, LP и т.д.), меняя таким образом объем записанного материала. Эта гибкость, в частности, и сделала MPEG2 основой для приема/передачи цифрового телевидения по различным цифровым сетям.

В результате для фильмов, созданных в стандартах PAL и SECAM, поддерживается разрешение 720х576 при 25 кадрах в секунду при качестве, практически не уступающем вещательному. Собственно, MPEG-фильм нельзя отнести к какой-либо системе цветного телевидения, так как кадры в MPEG являются просто картинками и не имеют прямого отношения к исходной для фильма системе телевидения; речь может идти о соответствии размера и частоты следования кадров.
В части аудио в MPEG2, по сравнению с MPEG1, добавлена поддержка многоканального звука(Dolby Digital 5.1, DTS и т.п.)

MPEG3

Прежде всего, не следует смешивать с широкоизвестным форматом компрессии звука МР3, о котором речь пойдет ниже. Стандарт MPEG3 первоначально разрабатывался для использования в системах телевидения высокой четкости (High Definition Television, HDTV) со скоростью потока данных 20-40 Мбит/с. Но еще в процессе разработки стало ясно, что параметры, требуемые для передачи HDTV, вполне обеспечиваются использованием стандарта MPEG2 при увеличенной скорости цифрового потока. Другими словами, острой нужды в существовании отдельного стандарта для HDTV нет. Таким образом, MPEG3, еще не родившись, стал фактически составной частью стандарта MPEG2 и отдельно теперь даже не упоминается.

MPEG4

В новом стандарте MPEG4, появившемся в самом конце 1999 г., предложен более широкий взгляд на медиа-реальность. Стандарт задает принципы работы с контентом (цифровым представлением медиа-данных) для трех областей: собственно интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Интернет), графических приложений (синтетического контента) и цифрового телевидения (DTV). Фактически данный стандарт задает правила организации среды, причем среды объектно ориентированной. Он имеет дело не просто с потоками и массивами медиа-данных, а с медиа-объектами (ключевое понятие стандарта). В MPEG4 определен двоичный язык описания объектов, классов и сцен BIFS, который разработчики характеризуют как "расширение С++". Помимо работы с аудио- и видеоданными, стандарт позволяет работать с естественными и синтезированными компьютером 2D- и 3D-объектами, производить привязку их взаимного расположения и синхронизацию друг относительно друга, а также указывает их интерактивное взаимодействие с пользователем.
Картинка разделяется на составные элементы - медиа-обьекты, описывается структура этих объектов и их взаимосвязи, чтобы затем собрать их в единую видеозвуковую сцену. Результирующая сцена составляется из медиа-объектов, объединенных в иерархическую структуру:

а) неподвижные картинки (например, фон);
б) видеообъекты (например, говорящий человек);
в) аудиообъекты (голос, связанный с этим человеком);
г) текст, связанный с этой сценой;
д) синтетические объекты, которых не было изначально в описываемой сцене, но которые туда
добавляются при демонстрации конечному пользователю (например, синтезируется говорящая голова);
е) текст (например, связанный с головой), из которого в конце синтезируется голос.

Такой способ представления данных позволяет изменить результирующую сцену, обеспечивая высокий уровень интерактивности для конечного пользователя и предоставляя ему целый ряд возможностей, например: перемещать и помещать объекты в любое место сцены, трансформировать объекты, изменять их форму и геометрические размеры, собирать из отдельных объектов составной объект и производить над ним какие-либо операции, менять текстуру и цвет объекта, манипулировать им (заставить, к примеру, стол передвигаться в пространстве), менять точку наблюдения за всей сценой.
Особое внимание уделим довольно узкой области приложения стандарта MPEG4 - сжатию видеоматериалов, поскольку именно эта область, скорее всего, на практике хорошо известна значительному числу пользователей-зрителей по аббревиатуре MР4 (так условно обозначают фильмы, сжатые кодером по стандарту MPEG4). Алгоритм компрессии видео, в принципе, работает по той же схеме, что и в предыдущих стандартах, но есть несколько радикальных нововведений. В отличие от прежних стандартов, которые делили кадр на квадратные блоки вне зависимости от содержимого, новый кодер оперирует целыми объектами произвольной формы. К примеру, человек, двигающийся по комнате, будет восприниматься как отдельный объект, перемещающийся относительно другого неподвижного объекта - заднего плана. Также применен "интеллектуальный" способ расстановки ключевых кадров. Ключевые кадры не расставляются с заданной регулярностью, а выделяются кодером только в те моменты, в которые происходит смена сюжета. Естественно, разветвленные алгоритмы поиска и обработки объектов сложной формы, углубленного анализа последовательностей кадров требуют существенно больших вычислительных ресурсов для качественного восстановления (декомпрессии) изображения этого формата, нежели в случае MPEG1 и -2. К счастью, производительность современных процессоров позволяет обойти это препятствие. В результате усовершенствования эффективности компрессии видео в MPEG4 возросла настолько, что позволяет размещать полнометражный фильм длительностью полтора-два часа с весьма приличным качеством всего на одном стандартом компакт-диске (650 Мб)! Впрочем, не стоит питать иллюзий по поводу рекламируемого "DVD-качества" MPEG4-продукции. Следует помнить, что, сколь совершенным не является кодер, всегда существует ограничение на минимальный размер (поток) сжатого видео. Поэтому фильмы в MPEG4, размещенные даже на двух компакт-дисках (2х650 Мб), все-таки не дотягивают до качества DVD-видео в стандарте MPEG2.

Здесь размеренное течение событий нарушается и неожиданно приобретает детективно-драматическую окраску. В борьбе с конкурентами на рынке потокового видео (в частности, упомянем компьютерную компанию Apple и ее "софт" QuickTime) в корпорации Microsoft занялись разработкой кодера, позволяющего компрессировать видеопоток в соответствии со стандартом MPEG4. На одном из этапов отладки нового продукта бета-версия этого кодера стала достоянием широких масс: и хакерской общественности. А далее несколько нетерпеливых взломщиков (желающие могут именовать их по старинке "пиратами"), которые не хотели дожидаться окончания разработки Microsoft, внесли в эту программу небольшие усовершенствования, переименовали в DivX-кодер и выложили в информационную сеть для свободного использования. Усовершенствования коснулись, в первую очередь, предачи пользователям возможности самостоятельно компрессировать видео, настраивая качество, длительность и т.д. Дальше - больше: спустя примерно полгода теперь уже вполне легальная фирма DivXNetworks Inc. переработала этот продукт и сняла с него клеймо "Веселого Роджера". Обновленные версии кодера под тем же именем DivX все так же свободно доступны в сети всем желающим: www.divx.com (совпадение названий продукта и фирмы, естественно, неслучайно). Microsoft еще на "пиратской" стадии этой истории по вполне понятным "политическим" мотивам свернула разработки в данном направлении, включая в новые версии своих операционных систем только модуль для воспроизведения уже закодированного видео:

Как мы упоминали, фильмы на компакт-дисках с условной маркировкой МР4 уже широко представлены в торговых ларьках и на рынках. Их можно смотреть на большинстве современных компьютеров, вычислительной мощности которых достаточно для декодирования МР4-фильма в реальном масштабе времени. Можно и самому "упаковать" свое видео, установив программный DivX-кодер. Но по-настоящему массовому распространению видеопродукции, упакованной по стандарту MPEG4 (как дешевой альтернативы DVD), препятствует отсутствие аппаратных средств кодирования/декодирования видео. Заметим, что их распространение, в свою очередь, сдерживает отсутствие надежной защиты от несанкционированного копирования (в отличие от DVD, где этому уделено значительное внимание). Так что пока решается проблема авторских прав, смотреть МР4-фильмы можно будет только с помощью компьютера. Если эта проблема разрешится (а рынок подталкивает к этому разработчиков: смотрите информацию в разделе "Новинки"), МР-4 видеопродукция может потеснить DVD в области бытового видео. Киностудии, издатели и разработчики AV-аппаратуры не могут с безразличием относится к этим подвижкам: может быть, именно на DVD-дисках скоро будет возможна запись видеопрограмм высокой четкости (HDTV), а может: Впрочем, прогнозы - дело неблагодарное. Отметим только, что технологические основания для такого развития сюжета уже имеются:

MPEG7

Последняя, выпущенная в конце минувшего года разработка - новый стандарт MPEG7 - вовсе не является непосредственным продолжением линейки MPEG-предшественников, хотя по предмету стандартизации частично перекликается с ними. MPEG7 должен обеспечивать формализацию и стандартизацию описания различных типов мультимедийной информации (а не ее кодирования), чтобы гарантировать эффективный и быстрый ее поиск. Официально новый стандарт называют Multimedia Content Description Interface - интерфейс описания мультимедийных данных. В нем определен стандартный набор дескрипторов ("описывателей") для различных типов мультимедиа-информации. Здесь также стандартизируется способ определения своих дескрипторов и их взаимосвязи (Description Schemes). Для этих целей в MPEG7 вводится специализированный язык DDL (Description Definition Language - язык описания определений). Основная цель применения нового стандарта - эффективный поиск мультимедийной информации (естественно, специализированными поисковыми машинами) аналогично тому, как сейчас мы можем найти текст по каким-нибудь ключевым словам или фразе. Поясним на примерах.

Музыка: Сыграв несколько нот на клавиатуре, можно получить список музыкальных произведений, которые содержат такую последовательность звуков.
Графика: Нарисовав эскиз на экране, получим набор рисунков, содержащих подобный фрагмент.
Картины: Определив объект (задав его форму и текстуру), получим перечень картин, содержащий таковой.
Видео: Задав соответствующий объект и его движение, получим набор видео или анимационных роликов.
Голос: Задав фрагмент голоса певца, получим набор песен и видеоклипов, в которых он поет.

MHEG

Последнее замечание - о стандарте, который обозначается похожей на MPEG аббревиатурой MHEG. Он также имеет некоторое отношение к рассматриваемой нами теме, но, подчеркиваем, лишь некоторое, поскольку его применение планируется для передачи мультимедийной информации по различным коммуникационным сетям. MHEG разрабатывается другой группой специалистов, принадлежащей, впрочем, к все той же международной организации по стандартизации ISO. Называется группа соответственно Multimedia&Hypermedia Expert Group (экспертная группа по мультимедиа и гипермедиа). Разрабатываемый ею стандарт определяет правила обмена мультимедийной информацией (видео, звук, текст и любые другие данные) между произвольными мультимедийными приложениями. Стандартом MHEG также определяются нормы передачи информации любыми способами - через локальные сети, сети телекоммуникаций или вещания - с использованием так называемой объективной классификации (MHEG Object Classes). При этом сами объекты могут включать в себя любую систему кодирования (в частности, MPEG), которая определяется конкретным базовым приложением. Стандартные MHEG-объекты должны создаваться мультимедийными приложениями с использованием специализированного языка - Multimedia Scripting Language. Стандарт MHEG уже признан советом по цифровому видео и звуку (DAVIC, Digital Audio-Visual Council).Разработчики утверждают, что MHEG - это будущий международный стандарт для интерактивного телевидения, так как он работает на любых платформах, а документация по нему распространяется совершенно свободно.

Звук в MPEG

И в завершение, как обещали, немного о звуке в стандартах MPEG. Кодирование звука и музыки осуществляется отдельным аудиокодером. По мере развития стандарта MPEG звуковые кодеры также совершенствовались, становясь все эффективнее. В основе повышения эффективности - та же идея: сократить объем "второстепенной" для слушателя аудиоинформации. В результате в составе стандарта MPEG1 было создано семейство из трех звуковых кодеров, названных "слоями": Layer I, Layer II, Layer III. Все они, подобно видеокодерам, построены на несовершенстве "человеческого фактора": психоакустическая модель здесь эксплуатирует несовершенства слухового аппарата человека. По мнению ученых, в несжатом звуке передается много избыточной информации. Избыточной в том смысле, что человеческое ухо ее все равно не воспринимает. Большой эффект для сжатия дает, например, явление маскирования некоторых звуков. В частности, если сначала подать громкий звук на частоте 1000 Гц, то более тихий звук на частоте 1100 Гц уже не будет фиксироваться слухом. В модели используется и явление ослабления чувствительности человеческого уха на период в 5 мс - до и 100 мс - после возникновения сильного звука. Существуют похожие временные эффекты маскирования; известны и более сложные взаимодействия, когда временный эффект может выделить конкретную частоту или, наоборот, подавить. Психоакустическая модель - как свод правил - разбивает весь спектр на блоки, в которых уровень звука считается близким. Затем удаляет звуки, формально не воспринимаемые человеком в соответствии с описанными выше эффектами. Потом следует процедура "упаковки" методами, напоминающими по принципу компьютерные архиваторы (опять же - с устранением избыточности), и, наконец, формируется цифровой информационный поток. Идеология сжатия всех "слоев" сходна, разница - в методах и в математике.

Первый "слой" (Layer I) был рассчитан на поток скоростью 192 кбит/с на канал. Алгоритм его в целом похож на систему сжатия звука ATRAC, которая реализована на мини-дисках Sony. Разновидность Layer I используется и в устройствах записи цифровых компакт-кассет DCC. Разновидность Layer II, предназначенная для потоков до 128 кбит/с на канал, была разработана как компромисс между качеством звука, величиной потока и сложностью кодера. В нем были, в первую очередь, усовершенствованы гребенчатые фильтры. Этот "слой" весьма сходен с известным аудиостандартом MUSICAM. Наибольшее применение Layer II нашел в сетях цифрового радиовещания DAB (Digital Audio Broadcasting).

И, наконец, Layer III исходно был рассчитан на низкоскоростные сети с потоком до 64 кбит/с на канал. Благодаря усилиям до того малоизвестного немецкого института информационных технологий имени Фраунгофера (IIS Fraunhofer) в 1998 г. был сделан почти революционный прорыв. Усовершенствование математики в части алгоритма преобразования Фурье и механизмов упаковки спектральных коэффициентов позволило сохранить " CD-качество" звука при низкой скорости потока. Естественно, такое достижение потребовало больших вычислительных ресурсов, но производительности современных компьютеров к тому времени уже хватало и на это. В результате появился формат сжатия аудиоинформации МР3 (полное его название - MPEG Audio Layer III), который начал вполне самостоятельную жизнь. Тот же институт Фраунгофера выпустил первый аппаратный кодер, работающий в реальном времени. За этим шагом последовали другие (МР3-Pro). Сегодня миниатюрные МР3-плейеры и диктофоны с флэш-картами разных мастей знакомы многим. Любой пользователь Интернета знает о распространении сжатого звука через сеть, знает о серверах, "набитых" музыкой в формате МР3. Естественно, вслед за удачным решением массовому потребителю уже предложены форматы-конкуренты, в частности, WMA от Microsoft, ААС (как "продвинутый" Dolby Digital АС-3): Здесь уместно упомянуть и технологию Meridian Lossless Packing (MLP), которая, напротив, используется в аудиофильских записях DVD-Audio - но это предмет, достойный отдельного разговора.

Материал взят с сайта: http://bercov.h1.ru/mpeg.htm






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных