Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.


Содержание
Выберите стандартный внешний вид (skin) программы Winamp. На клавиатуре медленно наберите слово nullsoft, нажимая клавишу после каждой буквы. Вместо названия окна программы Winamp появится строчка текста, которая, в частности, озвучена в демонстрационном файле demo.mp3. Перевод текста оставляем читателю. Рис. 7.21. Программа Winamp накапливает статистику своего использования Декодирование файлов формата MP3 Для декодирования звуковых файлов формата MP3 и их сохранения, например, в формате WAV можно воспользоваться специальными программами-декодерами. Однако многие программы-проигрыватели файлов MP3 обладают возможностью такого преобразования. В частности, таким свойством обладает программа Winamp. Для того чтобы преобразовать звуковой файл MP3 в формат WAV необходимо сделать следующее. В меню Options/Preferences выберите вкладку Audio I/O. В окне Output Plug-Ins выберите строчку Nullsoft Disk Writer Plug-In. (рис. 7.22). Нажмите кнопку Configure и выберите имя каталога, в котором будут сохраняться создаваемые файлы. Запустите режим воспроизведения. Вместо воспроизведения звука будут создаваться файлы формата WAV. Рис. 7.22. Вкладка Audio I/O окна Winamp/Preferences Программа Winamp сохраняет сделанные вами настройки. Если в следующий раз вы захотите прослушать фонограмму вместо преобразования файла, то нужно не забыть вернуться к исходным установкам. Процесс преобразования внешне выглядит точно так же, как и воспроизведения. Даже модули визуализации в процессе преобразования будут работать, однако звука не будет слышно. Где найти файлы MP3? В последнее время хранение музыкальных записей в формате MP3 получило очень широкое распространение. В сети Интернет уже существует довольно большое количество сайтов, посвященных коллекциям фонограмм в этом формате, причем их число постоянно растет. Найти сайты не представляет труда, воспользовавшись любой поисковой системой. Для этого достаточно для поиска ввести ключевое слово «MP3». Заметим, что таким же образом можно найти и коллекции в других форматах, описанных ниже (например, VQF). Что же касается нового формата хранения звука МР4, то о нем пока ничего не слышно, поэтому поиск по ключу «МР4» приведет к чему угодно, но не к музыкальным сайтам. Приведем адреса лишь некоторых наиболее интересных сайтов. На рис. 7.23 показана одна из страничек сети Интернет, посвященная музыке (http://www.omen.orc.ru/fl8.htm). Рис. 7.23. Одна из многочисленных русскоязычных страничек, посвященных музыкальным ресурсам в сети Интернет Рис. 7.24. Официальный сайт фонда В. Высоцкого Множество сайтов на русском языке посвящено авторской песне, в частности, отдельным исполнителям. Например, можно найти страничку, целиком посвященную В. Высоцкому (рис. 7.24). Адрес сайта http://kulichki.rambler.ru/masha/vysotsky. Приведем список некоторых наиболее известных русскоязычных сайтов с музыкальными коллекциями: Создание звуковых файлов MP3 Оказывается, что создать звуковые файлы формата MP3 может практически каждый в домашних условиях. Для этого необходимо иметь источник аудиоданных (обычно это аудио CD) и пару программ. Создание файла выполняется в два почти независимых этапа. На первом этапе следует получить файл формата WAV (стандартного звукового файла Microsoft Windows), а на втором этапе выполнить его кодирование в формат MP3. Эти этапы можно проделать непосредственно друг за другом, но можно и разделить промежутком времени. Что они в себя включают? Входным источником для большинства программ-кодировщиков служат WAV-файлы. Некоторые из кодировщиков (для UNIX и OS Macintosh) поддерживают и другие входные форматы. Информация же на CD содержится в специфическом «звуковом» формате в соответствии со стандартом ISO-9680 для записи аудио CD. Перед кодировкой необходимо вычленить такой WAV-файл, что и является первым этапом. Для считывания музыки с аудио CD можно, конечно, прогнать звук через звуковую карту и, воспользовавшись каким-либо звуковым редактором, сохранить данные в виде WAV-файла. Однако это наихудший путь для вычленения звука. Кроме музыки будет сохранен весь набор шумов, который только может породить звуковая карта. Использование звуковой карты оправдано только для тех случаев, когда нет возможности взять музыку непосредственно с CD, например, при записи с радио, магнитофона и т. д. Для считывания музыки с CD пользуются специальными программами, способными перевести данные из аудиоформата в WAV-файл без использования звуковой карты. Такие программы носят название «рипперы» (rippers). В переводе на русский язык для их обозначения используются также термины «нарезальщик», «сдиратель», «грабилка» и др. В последнее время таких программ появилось довольно много, причем cреди них есть условно-бесплатные и вовсе бесплатные. Их обилие определяется в основном тем, что каждая программа поддерживает определенный набор моделей CD, с которым можно ознакомиться в описании программы. Заметим, что далеко не все приводы компакт-дисков поддерживают операцию чтения аудиодорожек (Reading raw audio stream). Для выбора программы-риппера, просмотрите таблицу, приведенную в приложении 3, и определите главное: поддерживает ли вообще ваша модель CD-ROM такое считывание, и если да, то каким из нарезальщиков рекомендуется пользоваться. Программы вычленения файлов с аудио CD Одной из наиболее популярных программ-рипперов является WinDAC (Windows Digital Audio Copy). Эта программа поддерживает большое количество приводов CD-ROM, в частности все модели с интерфейсом SCSI. По адресу http://www.windac.de/ можно получить полную версию программы. Второе место по популярности занимает программа AudioGrabber. Эта программа не умеет работать с драйверами SCSI, однако прекрасно работает с устройствами интерфейса IDE. Информацию о программе можно получить по адресам http://www.audiograbber.com-us.net, http://audiograbber.da.ru/. Менее популярной является программа CDCopy, работающая в Windows (http://www.cdcopy.sk/). Среди программ, работающих в среде DOS, следует упомянуть CDDA (CD Digital Audio) и CD2WAV. Информацию о работе с этими программами можно получить на сайтах http://www.mp3.com, http://www.multimania.com. Из русскоязычных сайтов можно рекомендовать обратиться к страничке http://members.xoom.com/kandid/. Остановимся теперь на программах-кодировщиках. Эти программы на входе принимают WAV-файл и выполняют его кодирование в формат MP3. Часть программ позволяет работать из командной строки, что дает возможность выполнять их запуск непосредственно из программ-рипперов после считывания очередного трека. Такой возможностью, например, обладает программа-риппер WinDAC, которая имеет механизм написания и запуска скриптов. Некоторые из программ-кодировщиков могут принимать поток данных, поступающих от программы-риппера, и кодировать его без создания промежуточных WAV-файлов. Появились также программы, представляющие собой объединение кодировщика вместе с риппером (к числу таких можно отнести программу CDex). Несмотря на большое разнообразие программ-кодировщиков, многие из них используют одни и те же библиотеки, т. е. в сущности, являются программами-оболочками, предоставляющие удобный интерфейс к кодировщикам, работающим из командной строки, или установленным в системе кодерам. Программы такого рода (их называют front-end-программами) передают введенные параметры непосредственно кодировщику и ожидают завершения процесса кодирования. Сами кодировщики называют двигателями кодирования. Разнообразных двигателей кодирования, в отличие от программ, не так уж и много. Прежде всего, нужно выделить кодировщики, разработанные немецким институтом Fraunhofer IIS (Institut Integrierte Schaltungen), варианты которых используются в программах MP3 Producer, MP3 Compressor, 13enc, mp3enc, AudioActive. Институт Fraunhofer IIS (рис. 7.25), в стенах которого выполнены основополагающие разработки систем сжатия звука, является признанным лидером среди научно-исследовательских лабораторий в области мультимедийных приложений (http://www.iis.fhg.de). Одной из первых программ-кодировщиков является 13enc, 16-битовая программа, работающая в среде DOS. Другая программа mp3enc — дальнейшее развитие 13enc для 32-битовых систем, все также работающая из командной строки, выполняет кодирование значительно быстрее, однако проявляет себя хуже в плане сохранения высоких частот. Рис. 7.25. Страница института Fraunhofer IIS, известного своими разработками в области сжатия аудиоданных Программа MP3 Producer (рис. 7.26) считается лучшим кодировщиком (по мнению авторов сайта www.mp3bench.com). При установке этой программы в систему Windows становится доступен кодер MP3, который может затем использоваться из любой программы работы со звуком. Например, можно воспользоваться стандартной программой Фонограф (Sound Recorder) и сохранять файлы в формате MP3. Список установленных в системе кодеров можно увидеть, выбрав нужный пункт в панели управления (Control panel /Multimedia/Audio compression). Последние версии MP3 Producer устанавливают в систему Windows только декодер файлов MP3, а код кодера интегрирован с самой программой. Рис. 7.26. Окно программы-кодировщика MP3 Producer Программа MP3 Compressor является оболочкой-интерфейсом к тому же кодеру, на котором основан и MP3 Producer. Интерфейс программы позволяет несколько иначе строить задачи кодирования и следить за их процессом. Это приложение предоставляет некоторые дополнительные возможности, не допускаемые в MP3 Producer. В частности, поддерживает работу в режиме LQ (режим, противоположный HQ — High Quality). При включенной опции LQ (Low Quality) кодировщик производит над каждым фрагментом некоторое фиксированное количество итераций, затрачивая на кодировку фрагмента определенное количество времени. Если же активизировать HQ, кодировщик будет продолжать итерационный процесс до тех пор, пока не перестанет улучшаться результат. Повышение качества в этом случае требует дополнительных временных затрат на кодировку, при этом размер выходного файла не меняется. Время кодирования при изменении режима HQ/LQ может изменяться в 2—3 раза. Другим несомненным достоинством программы является возможность задания большого количества файлов для кодировки и запуска программы из командной строки. Последние версии программы MP3 Producer (начиная с версии 2.1) также предоставляют возможность отключения режима HQ, а также имеют опцию пакетной обработки файлов (Batch Processor). Кроме того, теперь предоставляется возможность задания битрейта вплоть до 256 Кбит/с для высококачественных записей (ранние версии имели ограничение — до 128 Кбит/с). Другой известный производитель коммерческих кодеров MP3, компания Xing Tech (Xing Technology Corporation, адрес сайта корпорации http:// www.xingtech.com), специализируется на выпуске низкокачественных кодеров. Среди этой группы кодеров можно назвать XingMP3 Encoder, Mplifier, AudioCatalyst и др. Характерной особенностью кодировщиков от Xing Tech является высокая скорость работы (программа XingMP3 Encoder выполняет кодирование в 6—8 раз быстрее, чем MP3 Producer). Такая скорость достигается за счет безжалостного вырезания частот свыше 16 кГц, которые еще слышны человеку. В итоге, когда речь заходит о высоком качестве, кодировщики Xing Tech использованы быть не могут. Программа AudioCatalyst представляет собой объединение программы-риппера (на базе AudioGrabber) и кодировщика от Xing Tech. У кодировщиков данной группы (от Xing Tech) есть и некоторые интересные свойства. В последней версии кодировщика AudioCatalyst 1.5 реализована довольно интересная техника переменного битрейта (VBR, Variable Bit Rate). В результате кодер способен для того же суммарного объема в определенных ситуациях давать MP3-файлы даже более высокого качества, чем кодеры от Fraunhofer IIS, так как для сложно кодируемых участков становится возможным использование повышенных битрейтов, а для легко кодируемых, соответственно, — пониженных. Несомненным достоинством техники VBR-кодирования является то, что она базируется на внутренних возможностях формата MP3, не добавляя по сути ничего нового — просто эти возможности в полной мере не были использованы ранее. Соответственно, полученные MP3-файлы можно проиграть на любом MP3-плейере. Проблемы могут возникнуть иногда только при определении длительности звучания композиции, но на качество и полноценность воспроизведения это не влияет. Полностью технология переменного битрейта поддерживается программой Winamp, начиная с версии 2.09. Все остальные известные кодеры, авторство которых не принадлежит ни Fraunhofer IIS, ни Xing Tech, основаны на общедоступных исходных текстах кодера (ISO source), равномерно кодирующего разные частотные диапазоны, что приводит к наивысшему качеству кодирования на высоких битрейтах и вполне приличному на 128 Кбит/с. Но этот код достаточно медленный, поэтому существует единственный известный кодер, в котором он не подвергся обширным изменениям в целях оптимизации — mpegEnc. Эта программа считается эталоном качества для высших битрейтов. Из кодировщиков этой группы достойны также упоминания BladeEnc, Cdex и SoundLimit. Выбор кодировщика в конечном итоге определяется требованиями к качеству и времени кодирования. Для большинства любителей музыки среднего качества вполне достаточно возможностей кодировщика AudioCatalyst 1.5. Он обеспечивает наивысшую скорость кодирования и при этом дает вполне удовлетворительное качество звучания. Для обеспечения высшего качества придется прибегнуть к большим битрейтам и воспользоваться кодировщиками типа BladeEnc или mpegEnc. Из кодировщиков от Fraunhofer IIS, кроме популярных программ MP3 Producer и MP3 Compressor, рекомендуется опробовать их последнюю разработку — программу AudioActive. Информацию о программном обеспечении для работы со звуковыми файлами можно получить на сайтах: Выбор параметров кодирования Значительное количество встречающихся в сети Интернет файлов MP3 имеют частоту оцифровки 44,1 кГц, битрейт 128 Кбит/с и режим стерео. Считается, что такие параметры звуковых файлов обеспечивают качество, сопоставимое с аудио CD. На эти параметры и следует ориентироваться при подготовке звуковых файлов для дальнейшего прослушивания на аппаратуре среднего класса. На самом деле звучание файлов MP3 становится невозможно отличить от аудио CD только на битрейтах 256 Кбит/с и выше, что подтверждено профессиональными прослушивателями, нанятыми в свое время институтом Fraunhofer IIS. Однако использование битрейта 128 Кбит/с вместо 256 Кбит/с позволяет в два раза уменьшить размер файлов, что играет значительную роль при передаче по сети. При этом искажения сигнала можно ощутить только на высококлассной аппаратуре и то не на всякой фонограмме. Учитывая эти особенности принято считать, что 128 Кбит/с обеспечивает качество аудио CD. При кодировании можно поступиться качеством и выиграть в размере получаемых файлов (в зависимости от предназначения звуковых файлов). Для выбора параметров кодирования можно рекомендовать обратиться к табл. 7.6, по которой в зависимости от требуемого качества звука можно выбрать нужные параметры кодирования (важнейшим параметром для кодировщика является значение битрейта). Таблица 7.6. Приблизительные характеристики качества звука для различных режимов Качество звука Частотный диапазон, кГц Режим Битрейт, Кбит/с Степень сжатия Лучше, чем LW-радио Лучше, чем АМ-радио Заметим, что процесс кодирования достаточно длителен. Так, например, кодирование 4 минут музыки на Pentium-200 ММХ программой MP3 Producer в режиме HQ с битрейтом 128 Кбит/с занимает примерно 12 минут процессорного времени в отсутствие других задач. Переносные плейеры звуковых файлов МР3 Прочитав о возможностях хранения звука в формате MP3, у проницательного читателя должен появиться вопрос, не пора ли начать выпускать переносные устройства проигрывания (наподобие популярных уже на протяжении двух десятилетий аудиоплейеров). Спешим вас обрадовать, такие устройства уже существуют! Одни устройства предназначены для прослушивания файлов «на улице», другие же — для установки в автомобиле. Их можно разделить по принципу хранения данных — флэш-память, жесткие диски PC-card type I и II, а также способу расшифровки файлов — специальный процессор, предназначенный только для этих целей, или любой достаточно мощный RISC-процессор с низким энергопотреблением. Одним из первых переносных плейеров является MPMan, точной копией которого является плейер MPStation (http://www.mpstation.com) фирмы DigitalCast. Компания Z Company (которой, кстати, принадлежит сайт www.mp3.com) уже начала продажу в США плейеров MPMan (http://www.mpman.com), которые производятся корейской фирмой Saehan Information Systems. Плейер MPMan имеет размер с пачку сигарет (91x70x16,5 мм), весит всего 65 г (без батареек), не содержит движущихся частей и выпускается в двух вариантах. Модель с 32 Мб флэш-памяти может вместить до 30 минут записи, а модель с 64 Мб, соответственно, — один час. Питание осуществляется от двух аккумуляторных батарей напряжением 1,2 В, емкости которых хватает на 9 часов звучания. Плейер может устанавливаться в специальное устройство (Docking Station), оборудованное зарядным устройством и подключаться к компьютеру через стандартный параллельный порт. Один из крупнейших производителей аппаратуры для персональных компьютеров — компания Diamond Multimedia Systems выпустила свой портативный цифровой музыкальный плейер Rio PMP300 — первое устройство от крупной фирмы, способное воспроизводить записи, загруженные из Интернета. Плейер также имеет небольшие размеры (89x63x16 мм), весит всего 70 г. Данная модель имеет флэш-память емкостью 32 Мб с возможностью увеличения. Может подключаться к компьютеру через параллельный порт. Время заполнения флэш-карты не превышает 6 мин. Емкости батареек хватает на 12 часов непрерывного прослушивания. Вице-президент компании Diamond Multimedia Systems по корпоративному маркетингу Кен Вирт (Ken Wirt) считает, что этот продукт станет очень популярным. Компания планирует в ближайшее время довести объем производства до 10 тыс. штук в неделю. Это устройство размером меньше плейера Walkman обещает произвести переворот в музыкальной индустрии и приблизить эру цифрового распространения записей, предоставив больше возможностей независимым музыкальным группам. Видимо в ближайшее время произойдет резкий рост количества компаний, производящих подобную технику. В частности, компания Samsung объявила о завершении разработки своего плейера с названием «Yepp», выпускаемого в трех вариантах (от простого к сложному). Отличительными характеристиками этого плейера является наличие встроенного радиоприемника FM-диапазона с цифровой настройкой, а также возможность записи голоса, т. е. это устройство может использоваться в качестве диктофона. Для записи файлов формата MP3 предлагается отдельное устройство. Сведения о этих разработках можно получить на специальном сайте http://www.yepp.co.kr. Еще один переносной плейер — Clikman. Помимо основных функций в это устройство встроили органайзер для записи телефонов, расписания и т. д. Управление устройством осуществляется как при помощи встроенной цифровой клавиатуры, так и голосовыми командами. Для хранения всех данных используются диски Clik! от накопителей ZIP-Iomega емкостью 40 Мб. Все перечисленные возможности потребовали усложнения устройства, в результате его размеры и вес несколько превышают соответствующие параметры аналогичных устройств (вес составляет почти 200 г). Ознакомиться с новинкой более подробно можно непосредственно на сайте компании-производителя: Varo Vision Co (http://www.varovision.com/subl/clik.html). Однако, технологии использования формата MP3, по крайней мере, для крупной музыкальной индустрии свойственен один существенный недостаток, а именно, отсутствие средств защиты от копирования. Каждый желающий может распространять в Интернете любую преобразованную в этот формат песню: чтобы из одной копии сделать миллион, достаточно нажать на несколько клавиш. Это не нравится Американской ассоциации индустрии звукозаписи (RIAA — Recording Industry Association of America), представляющей около 90% этого бизнеса (http://www.riaa.com). Старший исполнительный вице-президент и генеральный юрисконсульт RIAA Кэри Шерман (Сагу Sherman) считает, что, бесплатно распространяя пиратские записи, новое устройство способно полностью разрушить индустрию. Сейчас большая часть музыкальных записей MP3 в Интернете — это пиратские копии. RIAA называет эту разработку шагом не вперед, а назад. Согласно заявлению ее представителей, Ассоциация видит очень мало легальных применений MP3 по сравнению с множеством вариантов пиратского использования. Компания также рассматривает возможность запрета импорта устройств типа MPMan в США. Встроить в плейер технологию флэш-памяти легко могли и другие компании, не менее смышленые, чем Diamond. Но они ожидали появления технологии защиты содержимого. С выпуском плейера Rio ситуация изменилась. Почему Sony должна ждать, если Diamond уже делает деньги? Эти слова Кэри Шермана оказались пророческими. Боясь отстать, Sony продемонстрировала на выставке Comdex прототипы подобных изделий. Это вызовет эффект домино, вы не успеете оглянуться, как артисты останутся абсолютно беззащитными. Опасения такого рода не беспочвенны. Интернет способен коренным образом изменить соотношение сил в музыкальной индустрии, что уже произошло в информационной технологии в целом. Споры о нарушении авторских прав при использовании цифровых плейеров дошли до суда. В результате эти электронные устройства признаны американским судом не относящимися к записывающим устройствам и потому не нарушающими авторские права. Суд Лос-Анджелеса в октябре 1998 г. разрешил производство и продажу устройства Rio и отказал истцу — Американской ассоциации индустрии звукозаписи в требовании к производителю прибора, фирме Diamond Multimedia, отчислять им проценты с продаж за «копирование музыкального материала». По оценке Роберта Кона, президента интернетовского сайта GoodNoise, предлагающего посетителям тысячи музыкальных записей, это решение суда «является большой победой молодых исполнителей, которые получают альтернативный способ распространения своих произведений». Влияние подобных устройств еще только осознается шоу-бизнесом. Они могут буквально перевернуть все аспекты работы музыкальной промышленности, включая практику распространения и лицензирования копий. Например, группы начнут конкурировать в реальном времени, выпуская не диск за диском, а песенку за песенкой, публикуя особо удачные концертные исполнения, и т. д. Легко представить себе, например, как трансформируется существующая в российских городах инфраструктура распространения популярной музыки среди подростков. Киоски с кассетами превратятся в пункты записи звуковых файлов со своими каналами доступа к Интернету и прокси-серверами. Успех у публики (а не у диск-жокеев радиостанций) станет доступен непосредственному измерению. Опубликовать свою запись через сеть Интернет сможет буквально любой, что правда может привести к засилию низкопробной продукции. Технология сжатия звуковых файлов MP3 постепенно проникает во все сферы использования звука. С развитием каналов передачи данных и возможностей сжатия эта технология вышла на уровень потоковой передачи данных в реальном времени, где до сих пор безраздельно господствовала технология RealAudio. Компания Nullsoft (http://www.nullsoft.com/), создатель знаменитого плейера Winamp теперь, кроме продвижения самого плейера, активно занимается развитием и пропагандой технологии ShoutCast, предназначенной для потоковой передачи аудиоданных в формате MP3. Единственное, что нужно обычному пользователю для того, чтобы послушать сетевую MP3-станцию, или открыть собственную, это сам плейер Winamp. По адресу http://www.shoutcast.com/ можно найти адреса более чем 300 серверов, вещающих в формате MP3, и список десяти лучших из них. Звуковые файлы формата VQF Популярность и широкое распространение технологий MP3 вызвали бурный рост числа разработок в области сжатия звука. Стали появляться новые стандарты и форматы хранения звука, которые в будущем, возможно, придут на смену существующим. В последующих разделах кратко остановимся на современных достижениях в этой области. Наряду с широко известным на сегодняшний день форматом MP3 сравнительно недавно появился формат VQF, имеющий более высокую степень сжатия и качество воспроизведения. Формат VQF основывается на технологии TwinVQ (Transform-domain Weighted Interleave Vector Quantization — векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Laboratories (http://www.hil.ntt.co.jp/top /index_e.html). Патент на использование этого формата принадлежит фирме NTT, однако основное программное обеспечение для работы с этим форматом предлагает фирма Yamaha. Компания Yamaha предлагает, пожалуй, лучшее программное обеспечение для создания и воспроизведения файлов формата VQF под маркой SoundVQ (http://www.yamaha.co.jp/english/xg/SoundVQ/). При установке плейера одновременно инсталлируются подключаемые модули для воспроизведения файлов VQF в браузеры Netscape и Internet Explorer. Существует также и программное обеспечение от компании разработчика технологии TwinVQ (http://music.jpn.net/software-e.html). Этот формат по использованию идей сжатия весьма похож на MP3. Приведем их сравнительные характеристики. VQF-файлы примерно на 30—35% меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также примерно на 30% выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы. Для качественного воспроизведения минимальным требованием является процессор Pentium-90, рекомендуется Pentium-200 MMX. Для кодирования минимальным требованием является компьютер с процессором Pentium-66. Высокая степень сжатия требует значительных временных затрат на кодирование файлов в формате VQF. Так кодирование 4 минут музыки на Pentium-200 MMX занимает примерно 20 минут процессорного времени. Это значительно больше, чем при кодировании файлов MP3. Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2—3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плейера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3, но субъективное восприятие различных композиций формата VQF дало старт затяжной полемике между приверженцами хорошо проверенного старого (MP3) и новинок (формата VQF и формата ААС, о котором пойдет речь далее). Узкопрофессиональные споры не мешают сделать широкой интернетовской общественности выбор в пользу нового формата. Наиболее распространенное мнение сейчас можно сформулировать примерно так: «Если и есть какие-то различия, то нужно быть профессиональным музыкантом, чтобы их заметить». На текущий момент в сети Интернет можно найти довольно много музыкальных произведений в формате VQF, однако их количество и степень популярности значительно уступают MP3. Также значительно меньше существует программ-плейеров и кодеров. Для проигрывания файлов можно рекомендовать программу K-Jofol. Появились также подключаемые модули для Winamp, проигрывающие файлы VQF (этот модуль использует декодер компании Yamaha). Программа K-Jofol версии 0.51 занимает 1,4 Мб (как раз одна дискетка). Позволяет воспроизводить файлы форматов VQF, ААС, MP3 и др. Дает возможность декодировать файлы в формат WAV. На сегодняшний день считается самым быстрым плейером, использующим свои собственные декодеры для всех форматов. Программе характерен оригинальный дизайн. Уже при инсталляции можно заметить (рис. 7.27), что авторы попытались уйти от традиционных прямоугольных окон, придав им вычурные формы (рис. 7.28, 7.29). На первых порах немного непривычно, однако довольно быстро удается приспособиться. Возможности и методы работы с программой во многом аналогичны другим плейерам. Рис. 7.27. Окно инсталлятора программы K-Jofol Рис. 7.28. Основное окно программы K-Jofol Рис. 7.29. Список проигрываемых файлов программы K-Jofol Информацию о формате VQF можно получить с официального сайта http://www.vqf.com. О программе K-Jofol можно узнать на сайте http://www.kjofol.org. Найти иную информацию в Интернете, а также файлы в этом формате, можно с помощью любой поисковой системы, указав для поиска слово «vqf. О быстром росте популярности этого формата свидетельствует следующий факт. Если в сентябре 1998 г. запрос по слову «vqf поисковой системе AltaVista давал всего 20 ссылок, то в начале 1999 г. по такому запросу выдавалось уже несколько тысяч ссылок. Популярность формата VQF пока значительно уступает MP3. Рынок программного обеспечения работы с такими звуковыми файлами еще не вполне устоялся. Частенько появляются сообщения о весьма неустойчивой работе многих программ-проигрывателей этого формата. Это относится и к подключаемым модулям программы Winamp (попадаются просто неработоспособные версии), так и программе K-Jofol. Если у вас воспроизведение файлов такого формата идет с явными искажениями (даже на достаточно мощной машине), попробуйте прежде всего обновить версию программы-проигрывателя или используйте другую программу. Только во вторую очередь следует грешить на сам звуковой файл. Звуковые файлы формата ААС Формат ААС (Advanced Audio Coding) представляет еще один из числа появившихся сравнительно форматов кодирования звуковой информации, в котором осуществляется сжатие с потерями. На сегодняшний момент ААС представляет собой лучшую систему сжатия высококачественного звука. Это последний из стандартов MPEG-2. Перевести ААС можно как «Продвинутое Аудио Кодирование», название, которое появилось из-за исключительно высокого качества звучания и очень сильной системы сжатия. На данный момент различают четыре разновидности формата ААС: HomeboyAAC AT&T a2bAAC Liquifier Pro AAC Astrid/Quartex AAC По всем объективным параметрам последние две модификации ААС превосходят как MP3, так и VQF. Все четыре разновидности несовместимы между собой и используют свои собственные программы кодирования и воспроизведения. Далее мы кратко их охарактеризуем. Это первая версия ААС, кодер для которой стал общедоступен. Ее можн о охарактеризовать одним словом — отвратительно. Крайне корявые и медленные кодеры в сочетании с отчетливо слышимыми искажениями сыграл и свою роль в отталкивании широких масс от этого формата. Единственным и его плюсами является достижение качества MP3 128 Кбит/с на более низк их битрейтах и наличие приятного и быстрого плейера BitAAC. Сейчас это т формат уже практически не используется и даже ссылки на программное обеспечение для него почти исчезли со страниц Интернета. Следует иметь в виду, что большинство программ, распространяемых через Интернет по д видом кодеров ААС, являются кодерами именно этого формата. Во времена появления и развития этой ветви ААС уже существовал формат VQF. Известная компания AT&T не могла остаться в стороне от технологий новых систем сжатия аудиоданных. При фирме было создано специальное подразделение, занимающееся созданием программ и раскруткой нового формата, который получил название a2b. Строго говоря, этот формат практически полностью следует тем же самым принципам компрессии, что и предыдущий. Однако фирмой были предприняты значительные усилия по повышению качества звучания (в результате чего снизилась степень сжатия) и внесению новых элементов в формат. Составной частью формата a2b стала возможность включения изображения исполнителя и текста песни внутрь аудиофайла. Также была разработана технология получения самовоспроизводящихся песен (исходную композицию можно преобразовать в .ехе-файл, включающий в себя все необходимые для воспроизведения, что увеличивало файл всего примерно на 170 Кб). Для файлов этого формата существует удобный и бесплатный плейер с поддержкой многих дополнительных возможностей. Однако, несмотря на мощнейшую рекламную компанию и на очевидные достоинства формата, он не нашел широкого применения по одной простой причине — отсутствию общедоступного кодера! Мало того, эта уважаемая фирма пыталась запатентовать и запретить к использованию все составные части формата. К счастью, это у нее не вышло, — патент был получен только на собственные нововведения. Сейчас уже рекламный пыл немного угас и со своего сайта компания предлагает приобрести уже готовые файлы или бесплатно скачать несколько композиций. Формат по степени сжатия превосходит MP3, но на 15—20% уступает VQF, РАС, Astrid/Quartex ААС и Liquifier Pro AAC. Качество звучания a2b 96 Кбит/с сравнимо с качеством MP3 128 Кбит/с и VQF 96 Кбит/с, но уступает Liquifier Pro AAC 96, Astrid/Quartex AAC 96 и РАС 96. Дополнительную информацию можно получить в Интернете по адресу http://www.a2bmusic.com/. Liquifier Pro AAC Естественно компания AT&T не могла остаться одинокой на рынке борьбы за первенство в области высококачественной компрессии звука. Через некоторое время фирма Liquid Audio нанесла если не сокрушительный, то очень опасный удар по честолюбивым замыслам остальных. Предложенная ей версия формата ААС наиболее четко следовала всем техническим тонкостям и в результате появилась лучшая на сегодняшний день система сжатия звука. Она по степени сжатия и качеству звучания превосходит все существующие в данный момент форматы. И хотя превосходство по сжатию над VQF и Astrid/Quartex AAC незначительное — минимальный битрейт, заслуживающий внимания, все те же 96 Кбит/с, звук превосходит все ожидания! К сожалению, политика компании Liquid Audio на данный момент слабо отличается от политики AT&T — есть отличный плейер, но нет общедоступного кодера (существовала демо-версия, но она работала только в он-лайне и через несколько дней неожиданно самоуничтожалась, а все закодированные ей файлы становились неработоспособными). Подводя итоги, заметим, что этот формат по всем параметрам превосходит все остальные и объективно является лучшим. Среди самых последних новостей отметим появление звуковых файлов в этом формате (они имеют расширение LQT), причем для их воспроизведения можно воспользоваться плейером компании Liquid Audio или же установить plugin для программы Winamp (in_lqt.dll), который на самом деле пользуется все тем же, несколько «исправленным» плейером, перенаправляя звук в программу Winamp. Дополнительную информацию можно получить в Интернете по адресу http://www.liquidaudio.com/. В октябре 1998 г. в «спор гигантов» вступило частное лицо. Никому не известный и скромный программист создал, на основе изданных фирмой NTT в мае исходников МР4, свою собственную систему компрессии! Им было предложено протестировать кодер, для чего он был выложен в Интернете по адресу http://www.geocities.com/ResearchTriangle/Facility/2141/. Уже через несколько дней после выхода новой версии популярного плейера K-Jofol, для которого автор формата Astrid/Quartex AAC написал декодирующий модуль, появились восторженные отклики. Кодер, обладающий непритязательным интерфейсом командной строки, по сжатию и качеству звучания превосходил кодировщики от AT&T ААС и YAMAHA VQF. При этом качество звука практически не уступало хваленому Liquifier Pro AAC. Почти одновременно появились графические интерфейсы (front-end) для нового кодировщика и масса хвалебных отзывов в разных источниках. При всех видимых недостатках сегодняшней версии 0.2 (поддержка только WAV 44 кГц/16 бит РСМ и степени сжатия только 64, 96 и 128 Кбит/с), она уже широко применяется (есть целые ftp-сайты с музыкой в этом формате) и все с нетерпением ждут новых версий. По степени сжатия и качеству звучания формат превосходит все остальные, кроме Liquifier Pro AAC, и является объективно лучшим среди тех, что имеют общедоступные кодеры и доступные для распространения в Интернете звуковые файлы. По сравнению с MP3 обеспечивается аналогичное качество при потоке на 30% меньше. Качество Astrid AAC 96 Кбит/с много лучше качества VQF/96 Кбит/с. Возможно также потоковое воспроизведение. Звуковые файлы формата РАС Несколько особняком от остальных систем кодирования стоит формат РАС (Perceptive Audio Coding). Впервые эта аббревиатура появилась в стенах лаборатории Bell Labs/Lucent Technologies (кстати, там же впервые появилось сокращение ААС) в самом конце 1997 года. Через некоторое время стали появляться очень интересные сообщения от других фирм-разработчиков, которые не могли не заинтриговать интересующегося человека. Так было заявлено о следующих возможностях: достижении качества MP3 128 Кбит/с в формате РАС с битрейтом 64 Кбит/с; поддержка потокового воспроизведения через Интернет; прямое преобразование из Audio-CD в РАС без промежуточных огромных WAV-файлов на диске; кодирование в реальном времени на Pentium-166 (даже не ММХ); защита от свободного распространения РАС-файлов по Интернету и на CD-R; широкие возможности упорядочения готовых РАС-файлов (плей-листы, каталоги, описания и т. д.). В середине лета 1998 г. известная фирма Celestial Technologies выпустила первую и до сих пор единственную программу для кодирования и воспроизведения звука в формате РАС — «Audio Library 1.0». Хотя программа бесплатно работает только 15 дней и позволяет в одном каталоге хранить не более 5-ти композиций, уже можно сделать кое-какие выводы. Первое, что бросается в глаза, это отсутствие, как таковых, файлов в формате РАС. Во время своей работы программа создает базу данных, состоящую из 8 файлов с расширением TPS, в отдельном каталоге, причем для воспроизведения необходимы минимум 7 из них (GREGLANG.TPS можно выкинуть) Увеличение количества композиций не меняет количества файлов — при добавлении новой песни в базу просто увеличивается размер файла SONGDATA.TPS. И во всем остальном программа удивляет. Хотя пока на битрейте 64 Кбит/с звук уступает MP3 128 Кбит/с, качество звучания РАС 128 Кбит/с поражает воображение. При этом кодер обеспечивает обещанную скорость кодирования. Большего сказать о данном формате пока не представляется возможным. Нужно подождать новых версий кодеров. Новую информацию можно получить по адресу http://www.celestialtech.com/. Новый формат хранения звука МР4 Работа над новыми стандартами в области хранения звука не стоит на месте. И вот, наконец, в ноябре 1998 г. все заинтересованные стороны пришли к согласию об окончательной спецификации нового формата сжатия звука МР4. Как и ожидалось, в основе нового формата лежат VQF и ААС. Появление нового стандарта, однако, не предполагает быстрого появления программ, работающих в этом формате. По самым оптимистичным прогнозам первые кодеры и плейеры появятся к началу-середине лета 1999г., а более или менее продвинутые, с оптимизацией скоростей кодирования и воспроизведения, программы следует ожидать не ранее 2000-го года. Следовательно, в ближайшее время всем придется пользоваться уже существующими форматами. Первые разработки по новому формату были представлены в январе 1999 г. компанией Global Music Outlet. Пока рано делать какие-либо выводы о возможностях и перспективах этого формата. Вполне может случиться, что формат с таким названием останется лишь в виде спецификации, а в реальной жизни будут появляться и использоваться другие форматы, предложенные отдельными компаниями. Вызывает некоторое удивление само название формата — МР4 из-за возможной путаницы с MPEG-4, форматом аудио- и видеокомпрессии, принятым Международной организацией по стандартизации в качестве открытого стандарта распространения мультимедийной информации. Между обеими технологиями нет ничего общего. Новости о развитии ситуации можно узнать на сайте http://mp4.globalmusic.com/. Компания Global Music Outlet обещала, что одной из первых записей в новом формате будут произведения группы Public Enemy, которые будут опубликованы на ее Web-сайте (http://www.public-enemy.com/). Компания также рассчитывает соблазнить «китов» музыкальной индустрии возможностью формата МР4 записывать звуковые файлы с защитой от нелицензионного копирования. Компания Microsoft, естественно, не могла обойти вниманием быстро развивающиеся технологии сжатия звуковых данных. Была разработана собственная технология кодирования звука, быстро получившая распространение. Формат соответствующих файлов получил название WMA (изначально он был назван ASF). Быстрому внедрению формата должна способствовать маркетинговая политика компании Microsoft, которая включила поддержку нового формата в свой проигрыватель (Media Player), который можно свободно получить с сайта компании. Также в свободном доступе кодировщик файлов формата WMA. Поддержка воспроизведения файлов WMA включена в программу Winamp с версии 2.20. Эту же программу можно использовать и в качестве кодировщика.
  • Пример
  • HTML аудио-как это работает
  • Поддержка аудио-браузеров HTML
  • Типы аудио-носителей HTML
  • Аудио-методы, свойства и события HTML
  • Как вставить на сайт аудио файл (музыку) с помощью HTML5
  • Поддержка браузеров
  • Добавление аудио файла на сайт
  • Как в html вставить фоновый звук, музыку
  • Фоновый звук bgsound
  • Музыка в html. Тег
  • Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.
  • Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.
  • Тег HTML аудио, музыка
  • Синтаксис
  • Примеры использования в HTML коде
  • Поддержка браузерами
  • Атрибуты тега audio
  • Музыка на сайте. Тег в HTML5
  • HTML начало
  • Создание HTML документов
  • Базовый документ HTML
  • HTML теги
  • Освоение HTML5 тега audio
  • Воспроизведение звука в цикле
  • Различные форматы файлов
  • Для старых браузеров
  • Управление воспроизведением через JavaScript
  • Читают сейчас
  • Похожие публикации
  • HTML5: старые теги нового назначения
  • Проблемы с HTML5
  • HTML5 Audio и Game Development: баги браузеров, проблемы и их решения, идеи
  • Вакансии AdBlock похитил этот баннер, но баннеры не зубы — отрастут Комментарии 19 Используем audio для вставки звукового файлу на сторінку Для незнающих украинских — имеется в виду «на страницу»? И «файл wtkbrjv» — файл целиком :) Обратите внимание на атрибут autoload, который используется для автоматического воспроизведения звука. Тем не менее Вам не следует автоматически воспроизводить звуки а сайте, ведь это надоедает пользователям. так autoload или autoplay? >Safari, например, может проигрывать MP3, а Firefox не может, и играет OGG-файлы вместо этого. Ну вот опять начинается. Каждый браузер реализует свое, а фронтэндеры в итоге мучаются и держат на своей машине целый зоопарк. С появлением достаточно быстрого соединения с сетью Интернет, Flash был единственным инструментом для воспроизведения звуков на веб-сайтах. Никого не насторожило, что с 1-й строчки идёт неправда? Издревле альтернативами флешу были теги object и embed, которые работали напрямую с звуковыми файлами, сильно зависели от настроек ОС и установленных кодеков, но всегда были независимы от флеша. И никогда не исчезали из браузеров. Так вот, почему бы, даже если и перевод, не поправить автора сочинения? Как обычно, в скобках «прим. перев.». Зачем вообще переводить автора, не полностью разбирающегося в теме? Лучше взять правильную часть, проверить, если надо, и написать своими словами. Тем более, что в комментах уже пишут, что и данные теги работают с глюками, поэтому не могут быть решением. Возможно, я уже начитался кучи всего по и мне кажется эта информация просто убогой бесполезной, детской… Если в гугле набрать , то выдаст кучу ответов, где написано то же самое что и в этой статье… тогда — зачем переводить было? Вот это лучше бы перевели, если так сильно хотелось что-то сделать. Все легко: ниже приведён код, который будет отображать сообщение для браузеров, которые не поддерживают тег audio. У сервера неправильно прописан MIME тип для ogg (application/octet-stream), из-за этого Firefox не играет (в отличие от Оперы и Хрома). Может автор знает, как это исправить? Отредактировать .htaccess невозможно. Пробовал указывать тип в тегах — не помогает. Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста. Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML. В данной главе вы ознакомитесь с основными принципами использования звука в компьютерах, необходимым программным и аппаратным обеспечением для воспроизведения звука. Узнаете, как настроить браузеры для приема и воспроизведения звука из сети Интернет. Будут рассмотрены подключаемые программные модули к браузерам, а также отдельные приложения, позволяющие воспроизводить все типы звуковых файлов. Вы узнаете об особенностях встраивания в HTML-документ звуковых файлов и использовании подключаемых модулей. Средства воспроизведения звука Еще совсем недавно единственным способом извлечения звуков при помощи компьютера было использование встроенного динамика, традиционно существовавшим на всех моделях персональных компьютеров. Хотя главным предназначением этого динамика была выдача коротких по длительности, чаще всего однотонных звуков, находились программисты, создававшие утилиты для воспроизведения целых музыкальных фрагментов. В наше время, когда термин «мультимедийный компьютер» стал привычным и уже не вызывает благоговейного трепета, большинство персональных компьютеров оснащаются звуковой картой и приводом для чтения компакт-дисков. Тем не менее, маленький динамик по-прежнему присутствует в каждом компьютере. За прошедшие годы компьютеры очень сильно изменились, в частности, отпала необходимость в некоторых устройствах и элементах конструкции. Так, например, современные компьютеры более не оснащаются кнопкой переключения режимов «Turbo», исчез замок для блокирования клавиатуры. Зато встроенный динамик все так же выполняет возложенные на него задачи. Не будет преувеличением сказать, что функционирование компьютера начинается со звука. Многие компьютеры при загрузке издают звуковой сигнал, по характеру которого можно определить правильность прохождения тестирования. Опытные пользователи даже при выключенном мониторе на слух могут определить корректность процесса запуска компьютера. Более того, до сих пор ряд программ используют возможности встроенного динамика для информирования пользователя, например, о завершении очередной фазы какого-либо процесса. Смысл этих рассуждений сводится к тому, что звуковая информация играла и играет весьма значительную роль в работе с компьютером. Для получения полноценного звука из компьютера нужна звуковая карта и колонки или наушники. За последние годы цена мультимедийных компонентов компьютера по отношению к общей цене значительно снизилась, что говорит о целесообразности их установки на компьютер. На сегодняшний день 8-битовые монофонические звуковые карты ушли в прошлое. Даже самые дешевые из них обеспечивают стереозвучание и работают в 16-битовом режиме. Установка звуковой карты вкупе с приводом чтения компакт-дисков превращает компьютер в музыкальный центр неплохого качества, а также обеспечивает возможность работы с мультимедийными программами. Вся информация, приводимая далее в этой главе, актуальна только для тех пользователей, компьютер которых оснащен звуковой картой. Как компьютер работает со звуком Существует два типа звуковых файлов, используемых в компьютерах: цифровые и музыкальные. Иногда выделяют еще один тип файлов — текстово-звуковые, в которых используется метод конвертирования текстового файла в звуки, близкие к человеческой речи, т. е. замена букв фонемами. Музыкальные файлы похожи на нотные листы, — мелодия в них хранится последовательностью музыкальных нот, и, кроме того, в них имеется информация об используемых для воспроизведения музыкальных инструментах. При проигрывании такой музыки звуковой адаптер может не просто генерировать звуки разной высоты, но и выбирать из памяти фрагменты звучаний реальных музыкальных инструментов и синтезировать мелодию. Использование таких звуков ограничено возможностями синтезатора. Большинство звуков, которых вы слышите из колонок компьютера, представляют собой оцифрованный звук. По своей сути оцифрованный звук довольно прост. Аналоговые по своей природе звуки, передаваемые по проводам в виде изменяющегося напряжения, преобразуются в цифровые данные, которые можно сохранять в компьютере в виде файлов. Такое преобразование выполняется при помощи аналого-цифрового преобразователя (АЦП). При воспроизведении выполняется обратное действие — преобразование из цифровой формы в аналоговую. Эта работа возлагается на звуковую карту компьютера. Пользователь может создать любое количество звуковых файлов, подключив к компьютеру микрофон или бытовой магнитофон и воспользовавшись стандартными программами записи звука. На качество получаемого оцифрованного звука влияет несколько факторов Важнейшим фактором является частота дискретизации звука (sampling rate ) или количество преобразований аналогового звука в цифровой (замеров), выполняемое за одну секунду. Чем больше частота дискретизации, тем выше качество звука и тем больше при воспроизведении он будет похож на оригинал. Обычно этот параметр лежит в диапазоне от 8 до 44,1 кГц. Увеличение частоты дискретизации приводит к пропорциональному росту размеров файла, поэтому здесь важен разумный компромисс. Другим фактором является разрядность дискретизации (sample rate), определяющая точность замеров. Типичными значениями являются 16 бит, 8 бит и др. Характеристикой звукового файла является также режим записи — моно или стерео. Выбор того или иного режима сразу же в два раза изменяет размер получаемого файла. Нетрудно подсчитать, сколько места на диске будут занимать оцифрованные звуки. Так, одна секунда фонограммы качества аудио CD (44100 замеров в секунду, 16 бит на канал, два канала) дает 172 Кб данных. Заметим, что полученная величина близка к скорости передачи данных односкоростных CD-приводов, большинство которых уже умели проигрывать аудиодиски. Сегодня скорости этих устройств значительно возросли, поэтому, тем более, проблем воспроизведения музыки не должно возникать. Выбор приведенных параметров оцифровки звука не случаен. Оказывается, что определить влияние факторов на качество звука довольно просто. Частота дискретизации определяет максимально возможную частоту воспроизведения звука. В соответствии с законом Найквиста, самая высокая частота воспроизведения равна половине частоты дискретизации. Так, при дискретизации 44,1 кГц звук можно воспроизводить с частотой 22,05 кГц. Такая частота с запасом перекрывает диапазон звуков, воспринимаемых большинством людей, и определяет практически идеальное качество. В то же время для передачи речи такой частоты, как правило, не требуется. Человеческая речь в основном укладывается в диапазон 3 кГц, поэтому в телефонных сетях оцифровка звука ведется на частоте 8 кГц. Разрядность дискретизации определяет фактор, представляющий собой отношение сигнала к шуму. Любой метод хранения и последующего воспроизведения звука вносит некоторые случайные потери, которые проявляются в виде шумов. Для оцифрованного звука шум определяется точностью замеров. Чем точнее измерение, тем меньше потенциальная возможность внесения шума. Еще одним фактором является наличие сжатия данных, целью которого является экономия места на диске и выигрыш во времени передачи файлов. Среди схем сжатия/хранения звуковых данных можно выделить схемы, обеспечивающие сжатие без потерь информации, а также схемы, позволяющие значительно (в 10 и более раз) уменьшить размеры файлов без заметного искажения звука. Подробное описание технологий хранения данных выходит за рамки этой книги, однако в конце главы все же будут даны некоторые практические рекомендации по работе с современными форматами звуковых данных, что вызвано необычайным ростом их популярности. Первые версии браузеров не имели встроенных средств для воспроизведения звука и, соответственно, на Web-страницах практически не встречалось звуковых файлов. Если же такие ссылки попадались, то сначала требовалось переписать файл на локальный диск, а затем воспользоваться внешней программой его воспроизведения. Технология подключаемых модулей изменила ситуацию. Теперь для браузеров имеется ряд подключаемых модулей, позволяющих воспроизводить звуковые файлы в различных форматах. Преимуществом использования подключаемых модулей по сравнению с внешними приложениями является возможность управления проигрыванием звуковых файлов прямо из окна браузера. Браузер Netscape поставляется вместе с подключаемым модулем LiveAudio, который часто называют «официальным» аудиоплейером Netscape. Модуль LiveAudio может работать со стандартными форматами AIFF, AU, MIDI и WAV. Этот модуль снабжен понятной и удобной консолью с кнопками воспроизведения, паузы, остановки и регулятором громкости. Модуль LiveAudio заменил вспомогательное приложение NAPlayer, сопровождавшего более ранние версии браузера Netscape Navigator. (Модуль LiveAudio начал поставляться с Netscape Navigator версии 3.0.) Приложение NAPlayer работало с форматами Sun/NeXT (AU и SND) и Mac/SGI (AIF и AIFF). LiveAudio имеет более широкие возможности и поддерживает следующие типы звуковых форматов: AIFF — формат звуковых файлов Mac/SGI AU — формат звуковых файлов Sun/NeXT MIDI— формат электронных музыкальных инструментов (Musical Instrument Digital Interface)
  • WAV — стандарт звуковых файлов операционной системы Windows Формат AU когда-то был стандартным для Интернета. Формат AIFF — стандарт для платформы Macintosh, формат WAV — наиболее типичен в операционной системе Windows. Таким образом, этот подключаемый модуль может воспроизводить большинство стандартных оцифрованных звуковых файлов, а также работать с музыкальным форматом MIDI. Управление модулем LiveAudio Если на Web-странице, загружаемой браузером Netscape, встречается звуковой файл одного из перечисленных выше форматов, модуль LiveAudio выводит в окне браузера консоль управления. Вид консоли управления определяется параметрами, указанными в тэге включения звукового файла в страницу. Модуль может работать как со встроенными (с помощью тега ), так и отдельными звуковыми файлами (например, можно создать ссылку на звуковой файл). В последнем случае консоль управления выводится в пустом окне браузера, при этом сама консоль будет иметь стандартный вид. Органы управления модулем понятны и просты в использовании. Кнопки такие же, как и у обычного аудиоплейера — останов, воспроизведение, пауза и регулятор громкости, имеется простое выпадающее меню (рис. 7.1). Рис. 7.1. Консоль управления модуля LiveAudio Щелчком мыши слева или справа от ручки регулятора громкости можно уменьшить или увеличить громкость воспроизведения. Линейка «светодиодов» внизу показывает текущий уровень звука. Темно-зеленые «светодиоды» индицируют диапазон 0—40%, светло-зеленые — диапазон 40—100%. Если на консоли щелкнуть правой кнопкой мыши, будет выведено выпадающее меню. Его пункты дублируют кнопки управления, а также обеспечивают возможность сохранения звукового файла на локальном диске (Save As. ) и содержат сведения об изготовителе модуля (пункт меню About). Пункт меню сохранения файла (Save As. ) есть только в последней версии модуля LiveAudio (версия 1.1). В предыдущей версии этот пункт отсутствовал, зато отображалась информация о текущей громкости звука (например, появлялась надпись Current Volume: 60.0%). Встраивание звуковых файлов в Web-страницу Для использования звуковых файлов на Web-странице можно применить любой из двух вариантов: встраивать файл с помощью тега , либо создать ссылку на звуковой файл. В любом случае фонограмму можно будет прослушать при просмотре страницы в браузере Netscape при помощи подключаемого модуля LiveAudio. Первый вариант дает большую гибкость в компоновке страницы. Как будет описано ниже, тег обладает значительным количеством параметров, задавая которые можно контролировать аспекты работы модуля LiveAudio. Однако у этих возможностей есть и оборотная сторона. Если страница, рассчитанная на использование модуля LiveAudio, будет просматриваться другим браузером, который, вероятнее всего, будет иметь свои средства для воспроизведения звука, то все уникальные для модуля настройки не будут работать. Использование же ссылки на файл является стандартным способом, применяемым для любых типов файлов. В примере 7.1 приведен HTML-документ, в котором имеются встроенные файлы, а также есть ссылка на звуковой файл. Пример 7.1. Пример документа, использующего звуковые фрагменты Пример использования звуковых файлов Встраивание звукового файла с полным набором органов управления консоли Встраивание звукового файла с ограниченным набором органов управления консоли В документе, приведенном в примере 7.1, используются два встроенных звуковых файла (example1.wav и example2.wav), а также есть ссылка на звуковой файл example.mid. При просмотре этого документа в браузере Netscape для каждого из встроенных файлов будет отображена консоль управления модуля LiveAudio (рис. 7.2). Для файла example1.wav консоль управления будет иметь полный набор кнопок управления (этот режим используется по умолчанию), причем воспроизведение начнется автоматически при загрузке документа (AUTOSTART= TRUE) . Окно консоли управления будет иметь размеры 144 на 60 пикселов. Для звукового файла example2.wav консоль управления будет иметь более компактные размеры (144 на 15 пикселов) и урезанный набор органов управления, что определено инструкцией CONTROLS=SMALLCONSOLE. Воспроизведение этого файла начнется только в случае, если пользователь нажмет соответствующую кнопку. Размеры консоли органов управления модуля LiveAudio имеют постоянные значения и не могут изменяться (например, при полном наборе органов управления — 144 на 60 пикселов). Значения размеров окна, отводимых под встраиваемый элемент параметрами HEIGHT и WIDTH, не должны быть меньше требуемых. Если же этими параметрами заданы размеры больше требуемых, то справа и снизу от консоли управления будет оставлено соответствующее свободное место. Рис. 7.2. Отображение документа со встроенными звуковыми файлами в браузере Netscape На третий звуковой файл, используемый в документе (example.mid), дана стандартная ссылка. Реализация этой ссылки откроет новое окно браузера Netscape с полной консолью управления и автоматически запустит файл на воспроизведение (рис. 7.1). В табл. 7.1 перечислены параметры тега и их значения, использующиеся совместно с модулем LiveAudio. Все параметры необязательные, за исключением SRC, WIDTH и HEIGHT, применяющихся при встраивании в HTML-документ большинства объектов. Таблица 7.1. Параметры тега Указывает имя воспроизводимого файла (форматы AU, AIFF, AIF, WAV, MIDI и MID). Обязательный параметр Определяет ширину консоли в пикселах. Обязательный параметр Определяет высоту консоли в пикселах. Обязательный параметр AUTOSTART= TRUE | FALSE Если имеет значение TRUE, воспроизведение начинается автоматически. По умолчанию — значение FALSE AUTOLOAD= TRUE | FALSE Если имеет значение FALSE, файл не загружается автоматически. По умолчанию — значение TRUE Воспроизведение начинается с указанного в минутах и секундах момента от начала файла. По умолчанию — 00:00 Воспроизведение оканчивается с указанного в минутах и секундах момента от начала файла. По умолчанию — это конец файла Громкость воспроизведения, указанная в процентах от максимальной. По умолчанию — последнее установленное значение Выравнивает консоль управления по отношению к тексту страницы. Может иметь значения CENTER, BASELINE, TOP, LEFT, RIGHT. По умолчанию — BASELINE Задает набор органов управления консоли. Может иметь следующие значения (они объяснены далее в этой таблице): CONSOLE, SMALLCONSOLE, PLAYBUTTON, PAUSEBUTTON, STOPBUTTON и VOLUMELEVER. По умолч анию — CONSOLE Полный набор органов управления Компактное представление консоли. Полный набор органов управления, кроме кнопки паузы Только кнопка воспроизведения Только кнопка паузы Только кнопка остановки. При этом файл выгружается Только регулятор громкости Комбинация органов управления, позволяющая включить в страницу несколько клипов. Например, можно указать CONSOLE=»MySetup» в двух тэгах одной страницы; при этом в обоих случаях вид консоли будет одинаковым Если для клипа задать параметры CONTROLS=»VOLUMELEVER» и CONSOLE= «_MASTERVOLUME», то изменение громкости звучания данного клипа будет отражаться на громкости всех остальных клипов, т. е. изменять громкость работы звуковой карты. Отображение документа, рассчитанного на определенный браузер, с помощью другого браузера может нарушить весь замысел автора. Посмотрим, как пример 7.2, будет выглядеть в браузере Microsoft Internet Explorer (рис. 7.3). Здесь для проигрывания встроенных звуковых файлов используется вспомогательное приложение Microsoft ActiveMovie, работающее как компонент браузера. Естественно, что это приложение не распознает большинства специфических параметров тега , рассчитанных на использование модуля LiveAudio браузера Netscape. В итоге, хотя оказывается вполне возможным прослушать все имеющиеся на странице звуковые файлы, внешний вид документа оставляет желать лучшего. Рис. 7.3. Отображение документа со встроенными звуковыми файлами в браузере Microsoft Internet Explorer Возможна и обратная ситуация. Документ, подготовленный с учетом требований браузера Internet Explorer, может неудачно отображаться браузером Netscape. Заметим, что приложение ActiveMovie предоставляет больше возможностей по управлению прослушиванием (рис. 7.4). Так, например, можно задать режим повторения фонограммы заранее заданное или бесконечное число раз. Есть возможность одновременного исполнения (с наложением звука) нескольких файлов встроенных на страницу, даже если они имеют одинаковый тип. Например, можно заставить играть два файла типа WAV одновременно, соорудив из браузера своего рода микшерский пульт. Этой возможности лишен модуль LiveAudio, в котором запуск одной фонограммы автоматически останавливает воспроизведение файла такого же типа. Исключением является возможность одновременного воспроизведения файла с оцифрованной музыкой и файла типа MIDI, что возможно всегда. Рис. 7.4. Консоль управления приложения ActiveMovie с полным набором кнопок Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами, то нужно сначала задать соответствующие MIME-типы. В табл. 7.2 перечислены MIME-типы и соответствующие им типы файлов, с которыми работает модуль LiveAudio. Таблица 7.2. MIME-типы и соответствующие им файлы Другие звуковые модули Кроме модуля LiveAudio, поставляемого с браузером Netscape, имеется довольно много других звуковых модулей, часть которых работает со своим, уникальным форматом хранения звука. Приведем краткую характеристику некоторых из них. В ряде случаев нет необходимости сохранять оцифрованный звук с параметрами, обеспечивающими качество звучания аудио CD. Напомним, что такое качество обеспечивается при частоте дискретизации 44,1 кГц, разрядностью 16 бит, стерео. Нетрудно подсчитать, что минута звучания потребует хранения около 10 Мб данных (44100×2 байтах2х60 = 10584000 байт). Записи такого качества сохраняют все оттенки звука, в частности, дают возможность воспроизведения всех высоких частот, слышимых человеческих ухом. Однако, для многих применений, например для передачи речевых сообщений, такое качество излишне. Для звуковых данных такого рода можно понизить объем хранимой информации, уменьшив характеристики оцифровки звука. Минимально возможными параметрами для хранения звука в стандартном формате WAV являются частота оцифровки 8 кГц, разрядность данных 8 бит, моно. Речь идет о хранении в подформате PCM, (Pulse Code Modulation, импульсно-кодовая модуляция), использующегося в большинстве случаев применения формата WAV. Этот подформат не предусматривает возможностей сжатия данных. При таких параметрах минута звучания уже потребует всего лишь около 0,5 Мб (8000x1x60 = 480000 байт). Выигрыш в 20 раз. Тем не менее, даже для такого звукового сообщения необходим поток 64 Кбит/с, что не дает возможности передавать данные по большинству модемов в реальном времени. Для решения этой задачи рядом компаний были разработаны модули, которые могут сохранять и воспроизводить звуковые сообщения со значительной степенью сжатия. Для речевых сообщений важнейшим фактором является разборчивость речи, которая сохраняется даже при сильном сжатии. К таким модулям относятся TrueSpeech, ToolVox, EchoSpeech и др. Модуль TrueSpeech компании DSP Group хранит звуки в своем собственном формате, сжимая данные до 60 Кб на одну минуту звучания (передача таких данных требует 8 Кбит/с). Поскольку в состав операционной системы Windows входит кодер/декодер для данного формата, то конвертировать оцифрованный звук в него можно при помощи стандартного приложения Фонограф (Sound Recorder). Более подробную информацию можно получить на сайте компании DSP Group: http://www.dspg.com/. Модуль ToolVox компании Voxware обеспечивает еще большую степень сжатия (до 53:1). После конвертирования речевого файла в формат VOX скорость потока данных сокращается до 2,4 Кбит/с. Для кодирования/декодирования данных используется кодировщик RT24, лицензию на использование которого получила компания Netscape. Появился также более новый кодер RT29, сокращающий поток данных до 2,9 Кбит/с. Компания Voxware ведет разработки программ для конвертирования текста в звуковые файлы и программ распознавания речи. Информацию о программном обеспечении, разрабатываемом компанией Voxware, можно получить на сайте: http://www.voxware.com/. Модуль EchoSpeech выполняет сжатие речи на частоте дискретизации 11025 Гц. Степень сжатия достигает значения 18.5:1, что уменьшает поток данных до 9,6 Кбит/с. Для создания файлов формата EchoSpeech нужно воспользоваться специальной программой -кодером Speech Coder. Программное обеспечение работы с файлами этого формата имеется по адресу http://www.echospeech.com/. Не стоит обольщаться, узнав о возможностях сжатия звука перечисленными выше программами. Запись любого музыкального произведения, сохраненного в этих форматах, будет звучать как со старой, заезженной пластинки. Существуют модули и для воспроизведения музыки в формате MIDI. Одним из наиболее известных среди них является модуль Crescendo компании LiveUpdate. При помощи браузера, оснащенного таким модулем, можно создавать Web-страницы с фоновыми музыкальными клипами и специальными звуковыми эффектами. Модуль запускается автоматически и работает без контрольной панели на экране. Модуль выпускается для систем Windows 95/NT и Macintosh и может быть скопирован со страницы http://www.Iiveupdate.com/midi.html. Усовершенствованная версия модуля, Crescendo Plus, имеет панель управления и поддерживает работу в реальном режиме времени, т. е. чтобы начать прослушивание, вам не надо ждать окончания загрузки звукового файла. Эту версию также можно найти на сайте компании LiveUpdate. Рис. 7.5. Web-страница, содержащая MIDI-файлы знаменитых рок-групп Формат электронных музыкальных инструментов MIDI вовсе не потерял своей популярности в связи с бурным развитием новых форматов хранения оцифрованного звука. До сих пор на Web-страницах встречается довольно много ссылок на файлы этого формата. Например, на сервере, посвященном трехсотлетию Санкт-Петербурга (1703—2003), можно услышать гимн города, хранящегося в формате MIDI. Кстати, этот сервер обещает быть очень интересным, его концепция, структура и наполнение определяются специальным наблюдательным советом, председателем которого является писатель Даниил Гранин. Содержание сервера (http://www.300.spb.ru) планируется обновлять вплоть до 2003 года. Встречаются целые сайты, посвященные музыкальным произведениям в формате MIDI (например, http://www.midi.ru). Множество страниц в Интернете посвящено дискографии различных музыкальных групп (например, http://rem.ifmo.ru/midi/, страничка этого сайта показана на рис. 7.5). С развитием возможностей Интернета актуальной стала задача проведения различных аудио- и видеоконференций, передачи вещания радиостанций в реальном времени. Технология RealAudio стала первой, предоставившей возможность передачи звуковых файлов в режиме реального времени. На сегодняшний день эта технология получила в Интернете широкое распространение, модуль RealAudio, несомненно, является самым популярным в Интернете приложением для вывода звуковых файлов. С сайта компании, разработавшей этот модуль, было скопировано несколько миллионов экземпляров плейера. В начале 1999 г. промелькнуло сообщение, что число зарегистрированных пользователей этой программы достигло 50 Мбиллионов. Разработка технологии RealAudio была выполнена компанией Progressive Networks (сейчас она называется RealNetworks). Компания в сети Интернет имеет свой сайт, популярность которого за последние годы необычайно увеличилась. Адрес сайта http://www.real.com. До недавнего времени сайт компании-разработчика технологии RealAudio имел адрес www.realaudio.com. Сейчас обращение по такому адресу приведет к странице www.real.com. RealAudio состоит из трех функционально связанных программ. Программа-кодировщик (RealProducer Pro) конвертирует готовые звуковые файлы или живой звук в файлы формата RealAudio. Программа-сервер (RealServer) передает эти файлы по сети. И, наконец, программа-плейер (RealPlayer G2) проигрывает файлы по мере их поступления на компьютер пользователя. Все три компонента доступны на сайте: http://www.real.com (рис. 7.6). Сайт содержит много полезной технической информации и звуковых примеров. Рис. 7.6. Сайт компании RealNetworks, посвященный технологии RealAudio Для прослушивания звуковых клипов достаточно иметь только программу-плейер RealPlayer. В случае если вы также планируете создавать свои собственные звуковые файлы и размещать их на сервере, необходимо иметь программу-кодировщик и программу-сервер. Ранние версии программы-плейера назывались RealAudio Player. Сегодня последняя версия программы называется RealPlayer G2. Эта программа является свободно распространяемой. Существует также коммерческая версия, имеющая название RealPlayer Plus G2. Коммерческая версия обладает несколько большими возможностями по сравнению с бесплатным вариантом. Различия в возможностях описаны в справочном файле, поставляемом вместе с программой. Исходными данными для кодирования в формат RealAudio являются готовые звуковые файлы, либо «живой» звук. Программа-кодировщик может создавать файлы, оптимизированные для модемов с различными скоростями. Типичными вариантами являются скорости 14,4 и 28,8 Кбит/с. В результате кодирования получается файл, размеры которого намного меньше размера исходного файла. Например, одноминутный файл формата WAV (частота 22 кГц, разрядность данных 16 бит, моно) занимает 2,6 Мб; кодированный файл формата RealAudio для скорости 14,4 составляет всего 60 Кб, а для скорости 28,8 — в два раза больше. Таким образом, достигается сжатие — 40:1 и 20:1 соответственно. Файл для скорости 14,4 по качеству сравним с АМ-вещанием и очень хорош для речи, а файл для скорости 28,8 звучит как монофоническая FM-передача и подходит практически для любой музыки. Процедура сжатия выполняет отбрасывание некоторой звуковой информации. Приходится пожертвовать качеством, чтобы получить выигрыш в скорости передачи. Это проявляется при прослушивании некоторой потерей глубины звучания. В Интернете информация может передаваться двумя способами. Одним вариантом является протокол TCP, лежащий в основе WWW, который подразумевает безошибочную передачу данных. Любая возникающая при передаче ошибка тут же исправляется повторной передачей. С другой стороны, существует протокол UDP, который подразумевает скоростную передачу с некоторыми потерями в точности. Наличие ошибок недопустимо, когда мы имеем дело с текстом или программным кодом, где важен каждый бит. Некоторые ошибки и неточности передачи звука воспринимаются нашим ухом как небольшой шум или статические разряды в процессе обычного радиоприема. При передаче звука более важна непрерывность передачи, здесь главное — не потерять целые блоки данных и поддерживать передачу в режиме реального времени. Поэтому сервер RealAudio использует протокол UDP. Возможен случайный пропуск того или другого звукового байта, зато звук передается непрерывно и в режиме реального времени. На самом деле в противоречии с названием технологии RealAudio передача радиопрограмм идет не совсем в реальном времени. Вещание различных серверов RealAudio обычно идет с некоторой задержкой, измеряемой минутами. С коллегой автора этих строк однажды приключилось следующее. Он зашел в комнату, где работало несколько компьютеров, на одном из которых шло вещание программы RealAudio. Связь была достаточно хорошая, что обеспечивало безупречную передачу звуковой программы. Поэтому определить на слух, идет ли настоящая радиопередача, пойманная из эфира радиоприемником, или же это программа RealAudio, не представлялось возможным. В некий момент в передаче прозвучали привычные сигналы точного времени. Как оказалось впоследствии, коллега, нисколько не сомневаясь в их правильности, автоматически взглянул на часы и, несколько удивившись их спешке, поставил точное время. В этот же день он чуть было не опоздал на поезд, так как программа RealAudio шла с почти десятиминутным запозданием. Сервер RealAudio является двухканальной системой: протокол UDP используется для передачи данных, а протокол TCP — для согласования с системой пользователя скорости передачи и трансляции команд. Программа-плейер RealPlayer Plus G2 Программа воспроизведения клипов формата RealAudio выпускается для систем Windows, Macintosh и UNIX. Программа для Windows называется RealPlayer G2 и является свободно распространяемой. Коммерческая версия имеет название RealPlayer Plus G2. Установка любого варианта программы на компьютер не составляет труда. Программа поставляется в виде самораспаковывающегося файла, запустив который и, следуя дальнейшим указаниям, можно осуществить установку. В состав устанавливаемого пакета входит как самостоятельная программа-плейер, так и подключаемые модули для браузеров. После завершения установки браузеры Netscape и Internet Explorer получат возможность воспроизводить клипы формата RealAudio. Как самостоятельная программа RealPlayer Plus G2 (рис. 7.7) является полнофункциональным приложением, позволяющим воспроизводить звуковые файлы от любого источника, включая локальный диск или удаленный сервер. Эта программа является одним из представителей растущего числа приложений, способных напрямую, без участия браузера, общаться с Интернетом. Программа-плейер RealPlayer Plus G2 как отдельная программа может служить вспомогательным приложением браузера или самостоятельно воспроизводить звуковые файлы. Если в Web-страницу включается ссылка на файл формата RealAudio, то при щелчке мышью на ней браузер запустит программу-плейер как вспомогательное приложение. Это приложение работает как отдельная задача и после окончания прослушивания требует ручного закрытия. Если же файл встроен непосредственно в страницу с помощью тега , браузер автоматически отобразит на экране консоль управления подключаемого модуля. Органы управления плейера очень просты. Панель управления содержит типичный набор кнопок: Воспроизведение, Пауза, Останов, Запись (доступна только для коммерческой версии) и индикатор текущего момента проигрывания с бегунком. Имеется также кнопка включения эквалайзера (только для коммерческой версии) и кнопка переключения внешнего вида плейера (полный/компактный). Может выводиться информация о проигрываемом клипе, время воспроизведения и длительность клипа. Имеется движковый регулятор громкости. Конкретный внешний вид плейера в значительной степени зависит от установок, выбранных пользователем в пункте меню View. Заметим, что внешний вид, а также набор пунктов меню сильно изменились по сравнению с более ранними версиями программы, поэтому их детальное описание представляется излишним. Рис. 7.7. Программа-плейер RealPlayer Plus G2 Если звуковой файл встраивается в страницу, то набор органов управления определяется автором страницы и зависит от значений параметров соответствующего тега . Правила записи параметров рассматриваются ниже. Встраивание в страницу звуковых файлов формата RealAudio Звуковые файлы, используемые технологией RealAudio, должны иметь расширение RA. Кроме того, принято использовать метафайлы с расширением RAM, которые представляют собой обычные текстовые файлы, каждая строчка которых содержит полный URL-адрес файла RA. Например: Такому файлу логично присвоить имя example.ram. Строчка pnm:// означает, что данные находятся на сервере RealAudio. Если на Web-страницах необходимо расположить ссылку на файл формата RealAudio, то обычно ссылаются на метафайл RAM, а не на сам файл RA, хотя это и не запрещено. Для чего так сделано? Метафайлы могут содержать целый список адресов файлов RA, которые будут воспроизводиться последовательно. Кроме того, в метафайлах могут располагаться сведения о моменте времени начала воспроизведения файлов, если требуется проигрывать их с определенного места. Для этого следует указать точку начала воспроизведения после адреса файла, отделив символом $: Полностью формат указания момента начала воспроизведения записывается следующим образом: где dd — дни, hh — часы, mm — минуты, ss — секунды и t — десятые доли секунды. Если вы хотите, чтобы при просмотре страницы использовался плейер как вспомогательное приложение, то достаточно лишь применить стандартную ссылку, например: Ссылка на метафайл Другим вариантом является встраивание с помощью тега , например: Обратите внимание, что при встраивании файлов для активизации подключаемого модуля, а не самостоятельного приложения, необходимо ссылаться на метафайл с расширением RPM, а не RAM. Никаких иных отличий, кроме расширения, правила записи метафайлов не имеют. Параметры WIDTH и HEIGHT указывают размеры окна для органов управления подключаемого модуля. Как и параметр SRC, они являются обязательными. Выбор значений размеров окна полностью определяется автором страницы. Подключаемый модуль построен таким образом, что его органы управления автоматически масштабируются по указанным размерам и, таким образом, всегда полностью занимают отводимое окно. В этом отличие, например, от модуля LiveAudio, описанного выше. Вот как выглядит обобщенный синтаксис тега , если он используется для встраивания файлов RealAudio: [CONTROLS=option] [AUTOSTART=True] [CONSOLE=value] [NOLABELS=True]> Параметры CONTROLS, AUTOSTART, NOLABELS и CONSOLE являются специфическими для RealAudio и могут отсутствовать. Параметр CONTROLS определяет набор органов управления модуля плейера RealAudio. В табл. 7.3 описаны возможные значения этого параметра. Таблица 7.3. Значения параметра CONTROLS Окно плейера содержит все органы управления, включая Control Panel, InfoVolumePanel и StatusBar. (Это значение используется по умолчанию) Окно плейера содержит кнопки воспроизведения, паузы, остановки, индикатор текущего положения и изображение регулятора громкости. (Аналог окна самостоятельного плейера, если не отмечена ни одна из опций меню View) Окно плейера содержит строки для вывода информации о файле и движковый регулятор громкости. (Аналог окна самостоятельного плейера, если отмечена опция Clip Info меню View) Окно плейера содержит строки для вывода информации о файле Окно плейера содержит строку состояния, указатели времени воспроизведения и длительности клипа. (Аналог окна самостоятельного плейера, если отмечена опция Status Bar меню View) Окно плейера содержит только кнопки воспроизведения и паузы Окно плейера содержит только кнопку остановки CONTROLS=VolumeSlider Окно плейера содержит только движковый регулятор громкости Окно плейера содержит только индикатор текущего положения Встраивает в строку состояния время воспроизведения и длительность клипа Встраивает в строку состояния текстовые сообщения Если параметру AUTOSTART присвоено значение TRUE, проигрывание файла начинается автоматически. Несколько файлов не могут звучать одновременно. Поэтому, если более одного тега имеют AUTOSTART=TRUE, только последний из них будет запущен автоматически. Порядок загрузки файлов зависит от программы-сервера и кэш-памяти браузера Netscape. Параметр CONSOLE позволяет создать несколько окон с различным набором органов управления, осуществляющими управление одним и тем же клипом. Изначально каждое окно связано со своим клипом; если же применить параметр CONSOLE, то предоставится возможность управлять одним клипом из различных окон. Например, запустить клип из одного окна, а остановить, пользуясь кнопками другого окна. Появляется возможность создания произвольного набора кнопок для отдельного клипа, расположенных также произвольным образом. Для реализации этого свойства следует указать одно и то же имя клипа в каждом из тегов , а также присвоить одинаковые значения параметру CONSOLE: Еще один пример на эту тему: Пример 7.2. Пример документа со встроенными файлами RealAudio Пример встраивания файлов формата RealAudio Различные варианты встраивания клипов формата RealAudio Кнопки воспроизведения/паузы, кнопка остановки и индикатор текущего положения Только панель управления Полный набор органов управления В примере 7.2 в HTML-документ встроено три клипа RealAudio и имеется ссылка на еще один файл. Отображение этого документа в браузере приведено на рис. 7.8. Первый из файлов sample1.rpm встраивается трижды с различным набором органов управления. Поскольку во всех этих тэгах есть строчка CONSOLE=clip1, то кнопки управления будут относиться к одному и тому же клипу. Например, запустив клип кнопкой воспроизведения, можно его остановить, нажав кнопку в другом окне (расположенном от него справа). По существу, все три окна, с точки зрения их функционирования, будут являться единой консолью управления для этого клипа. Естественно, что эти окна могли быть разбросаны по странице в произвольном порядке. При встраивании клипов RealAudio вид консоли управления определяется автором страницы. Рис. 7.8. Различные варианты встраивания клипов RealAudio Следующие два клипа иллюстрируют возможности встраивания консоли управления с различным набором кнопок. Файл sample1.rpm имеет следующее содержание: Остальные метафайлы имеют аналогичное содержание. Здесь для примера показано, что данные для плейера могут поступать не только от соответствующего сервера в реальном времени, а и представлять собой обычные файлы формата RA, расположенные локально. Продолжим рассмотрение значений параметров тега . Если параметру CONSOLE одного из тегов присвоить значение «master», то при запуске любого другого клипа на странице им можно управлять при помощи кнопок этого «главного» окна. Это удобно использовать, если вы, например, хотите, чтобы в странице было размещено несколько клипов с ограниченным набором органов управления, но при запуске любого из них иметь полный набор кнопок. Пример использования данного свойства приведен ниже. Пример 7 .3. Пример документа с мастер-консолью Встраивание нескольких клипов, управляемых одной консолью Альбом «The fat of the land» 1.rpm W > Smack my bitch up 5:42 Breathe 5:34 Diesel power 4:17 Funky shit 5:15 Serial thrilla 5:10 Mindf iels 5:39 Narayan 9:04 Firestarter 4:40 Climbatize 6:36 Fuel my fire 4 :18 В приведенном примере встроено десять клипов, объединенных для удобства в таблицу. Каждый из встроенных клипов имеет минимальный набор кнопок управления: воспроизведения и паузы, что определяется параметром controls=PlayButton. Справа от таблицы (рис. 7.9) располагается еще одна консоль управления с полным набором кнопок, для которой указано значение console=»_master». Заметим, что для этого окна также имеется отдельный встроенный файл (empty.rpm), содержимое которого никогда не используется. Единственное, что необходимо, это обеспечить существование непустого файла с таким именем. Рис. 7.9. Несколько встроенных клипов, управляемых из одного окна Запуск на воспроизведение любого из десяти встроенных клипов приводит к активизации мастер-консоли. В этом окне будут отображаться все параметры запущенного клипа, а также будут работать все кнопки управления. Последним параметром тега является NOLABELS. Если ему присвоено значение TRUE, то вывод информации о клипе (название, автор и копирайт) будет запрещен. Для тех пользователей, браузеры которых не поддерживают тег , включите после этого тега контейнер с альтернативным содержанием: Что-то для браузеров, не поддерживающих подключаемые модули К примеру, можно такой строке дать ссылку для запуска самостоятельной программы-плейера: Несмотря на то, что все примеры встраивания файлов формата RealAudio приведены для браузера Netscape, они будут точно также работать и в браузере Internet Explorer. Это заслуга компании-разработчика плейера. Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами формата RealAudio, то нужно задать соответствующие MIME-типы. В табл. 7.4 перечислены MIME-типы и соответствующие им расширения файлов. Таблица 7.4. MIME-типы для RealAudio audio/x-pn-realaudio/plugin RPM
  • Комментарии 19
  • Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.
  • Различные варианты встраивания клипов формата RealAudio
  • Кнопки воспроизведения/паузы, кнопка остановки и индикатор текущего положения
  • Только панель управления
  • Полный набор органов управления
  • Встраивание нескольких клипов, управляемых одной консолью
  • Илон Маск рекомендует:  Почему си хорошо, а си плохо

    HTML5 Аудио

    Аудио в Интернете

    До HTML5 звуковые файлы могли воспроизводиться только в браузере с подключаемым модулем (например, Flash).

    Поддержка браузера

    Номера в таблице указывают первую версию обозревателя, полностью поддерживающую элемент .

    Element
    4.0 9.0 3.5 4.0 10.5

    Элемент HTML

    Чтобы воспроизвести звуковой файл в формате HTML, используйте элемент :

    Пример

    HTML аудио-как это работает

    Атрибут controls добавляет элементы управления звуком, такие как воспроизведение, пауза и громкость.

    Элемент позволяет указать альтернативные аудиофайлы, которые могут быть выбраны обозревателем. Браузер будет использовать первый распознанный формат.

    Поддержка аудио-браузеров HTML

    В HTML5 есть 3 поддерживаемых аудио форматов: MP3, WAV и OGG.

    Поддержка браузера для различных форматов:

    Browser MP3 Wav Ogg
    Internet Explorer Да Нет Нет
    Chrome Да Да Да
    Firefox Да Да Да
    Safari Да Да Нет
    Opera Да Да Да

    Типы аудио-носителей HTML

    Формат файла Тип Медиа
    MP3 audio/mpeg
    Ogg audio/ogg
    Wav audio/wav

    Аудио-методы, свойства и события HTML

    HTML5 определяет методы, свойства и события DOM для элемента .

    Это позволяет загружать, воспроизводить и приостанавливать аудио, а также задавать длительность и громкость.

    Есть также события DOM, которые могут уведомить вас, когда звук начинает играть, приостановлено и т.д.

    Для полной справки по тегам перейдите к нашей справка аудио/видео в формате HTML5.

    Как вставить на сайт аудио файл (музыку) с помощью HTML5

    Здравствуйте, дорогие читатели блога. Не удивительно, что в последнее время медийные сайты становятся всё более популярными. На таких сайтах очень интересно находится, например можно посмотреть какое нибудь видео или же послушать отличную музыку. Но в этот раз мы будем с Вами слушать музыку, а именно научимся вставлять аудио файлы на наш сайт с помощью HTML5.

    Как оказывается, что HTML5 поддерживает аудио теги, и таким образом музыку вставить на сайт очень просто. Правда, что не все старые браузеры воспроизводят аудио файл, но все современные браузеры это делают на ура.

    Поддержка браузеров

    Например: IE9+ поддерживает только mp3 файлы, но не поддерживает wav и ogg.

    Chrome после 6 версии поддерживает практически все форматы.

    Opera 10+ не поддерживает mp3, честно, мне кажется что это её очень большой недостаток, такой популярный формат и не поддерживает. Но с wav и ogg справляется отлично.

    С браузером Firefox та же самая история, что и с Оперой. За это ей огромный и жирный минус.

    Safari поддерживает все форматы аудио кроме ogg.

    Добавление аудио файла на сайт

    Как видите, что тут добавлено сразу 3 файла, таким образом если какой то браузер не поддерживает mp3 он автоматически воспроизведёт тот формат который поддерживает и так далее.

    Но мы же добрые люди :-) И если пользователь не сможет прослушать музыку, мы дадим её ему скачать. Для этого Вам нужно добавить просто ссылки на файлы. Таким образом у нас получится следующий код:

    Таким образом пользователь сможет скачать файл :-)

    Друзья, а вот пример наших трудов. Простой проигрыватель браузер подставляет сам.

    Вот и всё, дорогие друзья. Если у Вас возникнут вопросы или трудности спрашивайте в комментариях. До скорых встреч.

    Как в html вставить фоновый звук, музыку

    Такая фича как фоновый звук на html странице на сайте нужна довольно редко, но все же, было дело мне понадобилась. Реализуется очень просто.

    Фоновый звук bgsound

    Таким образом можно вставить в html страницу на сайте аудифайл в одном из форматов: WAV, AU, MIDI. В код нужной страницы в теги body добавляем тег:

    Теперь при просмотре этой страницы всегда будет присутствовать фоновая музыка.

    • src — адрес звукового файла
    • loop — число повторов мелодии (если равно -1, звук повторяется бесконечно)
    • balance — стереобаланс (значения от -10000 до 10000) volume — громкость, максимальное значение = 0 (возможные значения от -10000 до 0)

    Выключить музыку пользователь не может, регулировать громкость не может, разве что у себя в микшере, проигрывается ограниченное количество форматов, как правило, тяжелых.

    Музыка в html. Тег

    Это одиночный тег, то есть закрывающего тега нет. Проигрывает множество аудиоформатов. Пример вставки:

    src = «путь к аудио-файлу».
    h — скрывает панель управление воспроизведением. Скрывать панель нужно если только очень нужно, потому как многих раздражает на сайтах музыка, которую нельзя выключить — может спит кто, а может просто играет своя песня.
    autostart = «true» — начинает воспроизводить звук сразу при загрузке страницы.
    loop = «true» — бесконечное зацикливание звука, «false» — однократное воспроизведение, «х», где Х — число повторов.
    type=»audio/x-mpeg» — подсказывает браузеру какой плагин использовать для воспроизведения (не обязателен, но надежнее указать) Если аудио-файл НЕ .mp3, лучше не использовать type вообще.
    w .
    volume = «x» [X=0. 100] — громкость звука в процентах, но не каждый браузер поддерживает регулировку звука.

    Хорошо настраивается, правильно понимается всеми браузерами (за исключением регулировки звука), проигрывает мп3

    Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.

    Язык HTML
    Вставка звука и видео

    Вставка звука. Тег
    Добавляет, воспроизводит и управляет настройками аудиозаписи на веб-странице. Путь к файлу задается через атрибут src или вложенный тег .

    Синтаксис:

    или

    Несколько элементов можно связать с различными файлами. Браузер будет использовать первый запускаемый формат.

    autoplay — звук начинает играть сразу после загрузки страницы;

    controls — добавляет панель управления к аудиофайлу;

    loop — повторяет воспроизведение звука с начала после его завершения;

    preload — используется для загрузки файла вместе с загрузкой веб-страницы;

    src — указывает путь к воспроизводимому файлу.

    Пример:

    Тег audio не поддерживается вашим браузером.

    Практическое задание:
    На один из готовых проектов (стихи, биология, анатомия, геграфия. ) разместить пояснительную звукозапись под заголовком проекта.

    Вставка видео. Тег
    Добавляет, воспроизводит и управляет настройками видеоролика на веб-странице. Путь к файлу задается через атрибут src или вложенный тег .

    Синтаксис:

    Несколько элементов можно связать с различными файлами. Браузер будет использовать первый запускаемый формат.

    autoplay — видео начинает воспроизводиться автоматически после загрузки страницы;

    controls — добавляет панель управления к видеоролику;

    loop — повторяет воспроизведение видео с начала после его завершения;

    height — задает высоту области для воспроизведения видеоролика;

    width — задает ширину области для воспроизведения видеоролика;

    preload — используется для загрузки видео вместе с загрузкой веб-страницы;

    src — указывает путь к воспроизводимому файлу.

    Закрывающий тег oбязателен.
    Внутри контейнера также можно написать пояснительный текст, который будет выводиться в браузерах, не работающих с этим тегом.
    Атрибут controls добавляет элементы управления видео, такие как воспроизведение, пауза, и объем.
    Неплохо всегда включать атрибуты ширины и высоты.
    Если высота и ширина не установлена, браузер не знает размер видео. Эффект будет такой, что страница будет обновляться (или будет мерцание) в то время как видео загружается.

    Пример:

    Тег video не поддерживается вашим браузером.

    Результат примера в браузере:

    Практическое задание:
    В один из готовых проектов (стихи, фильмы, биология, анатомия, геграфия. ) разместить подходящее видео из заготовок.

    На сервисе YouTube под видео-элементами есть кнопка «Поделиться» — «HTML-код», полученный код можно вставить в любое место HTML-документа для запуска этого ролика.

    Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.

    Всем привет!
    Сегодня я расскажу, как сделать фоновую музыку на сайте используя HTML.
    Это совершенно не сложно и не нужно быть гуру, чтобы создать такой эффект на сайте.
    Стоит вопрос, а нужно ли это для вашего сайта? Может, вашим пользователям или читателям этот эффект будет мешать? Или даже раздражать? Ведь, если у вас, например, обучающий сайт, то музыка будет отвлекать. Если вы делаете сайт для какой-то музыкальной группы или певца, возможно, этот эффект будет классным и в тему.

    Фоновая музыка на HTML5

    Чтобы сделать на странице сайта фоновую музыку, достаточно воспользоваться тегом .

    * Закрывающий тег обязателен.

    • « autoplay » определяет воспроизведение музыкального файла сразу же после загрузки страницы.
    • « autobuffer » используется в паре с « autoplay » – определяет воспроизведение музыкального файла уже в момент загрузки страницы.
    • « src » – путь к звуковому файлу.
    • « controls » показывает панель управления плеером.

    Фоновая музыка на HTML ( этот способ не рекомендую )

    Чтобы сделать на странице сайта фоновую музыку, достаточно воспользоваться тегом .

    Закрывающий тег не нужен.

    Тег размещается между тегами .

    • « Balance » — управляет балансом звука между правой и левой колонками.
      Если в значении указать « -10 000 », мелодия будет играть в левой колонке.
      Если в значении указать « 10 000 », мелодия будет играть в правой колонке.
      Если в значении указать « 0 », мелодия будет играть равномерно в обеих колонках.
    • « loop » — устанавливает, сколько раз проигрывать музыкальный файл. Значение по умолчанию « -1 » бесконечный повтор.
    • « src » — путь к музыкальному файлу.
    • « volume » — громкость музыки. Значение « -10 000 » – минимальная громкость, а значение « 0 » – по умолчанию соответствует текущей громкости воспроизведения.

    Тег HTML аудио, музыка

    Текстовую дороку к файлу можно указать при помощи тега .

    Этот тег был введен в HTML5.

    Синтаксис

    Примеры использования в HTML коде

    Поддержка браузерами

    Тег
    Да 9+ Да Да Да
    Поддержка форматов
    MP3 Да Да Да Да Да
    WAV Да Нет Да Да Да
    Ogg Да Нет Да Нет Да

    Атрибуты тега audio

    Если указан, аудио-дорожка будет воспроизведена, как только будет загружена.

    Если указан, будут выведены кнопки управления плеером (play, pause и т.д.).

    Если указан, аудио-дорожка будет циклически воспроизводиться до закрытия страницы (после завершения, воспроизведение начнется сначала).

    Если указан, аудио-дорожка будет воспроизводиться без звука.

    Определяет особенности загрузки аудио элемента.
    auto — загружать аудио-дорожку полностью при загрузке страницы.
    metadata — при загрузке страницы загружается только техническая информация (метаданные, например, продолжительность аудио).
    none — не загружать аудио при загрузке страницы.

    Если указан атрибут autoplay, атрибут preload будет проигнорирован.

    Музыка на сайте. Тег в HTML5

    Не секрет, что времена технологии flash, к сожалению или к счастью, уходят. Виной тому нежелание компании Adobe доработать свой продукт под современные нужды. А рынок диктует новые условия и сбрасывать со счетов такого гиганта, как Apple было не предусмотрительно.

    Apple полностью отказалась от поддержки технологии Flash в своих мобильных устройствах, в виду её чрезмерной ресурсоемкости, что в свою очередь, не лучшим образом сказывалось на времени автономной работы.

    До недавнего времени, вывод звукового оформления на сайтах осуществлялся на базе Flash. Впрочем и сейчас подавляющее большинство онлайн-радиостанций используют эту технологию, что конечно не радует владельцев i-девайсов.

    Но не всё так плохо, HTML5 наконец-то начал входить в жизнь, и толчок к его быстрому развитию и распространению, на мой взгляд, дало именно огромное количество устройств на базе iOS.

    HTML5, к примеру, предоставляет простую возможность добавления музыки на сайт с помощью тега . В предыдущем моем посте, о Конюхе Федорове, для вывода аудиофайла использовался как раз этот тег.

    Для проигрывания аудио файла в HTML5, достаточно разместить на страничке следующий код:

    Выглядеть это будет примерно так:

    В примере использована песня американской джазовой певицы Carmen Mercedes McRae.

    На текущий момент существует три основных формата для элемента .ogg, .mp3 и .wav. Однако, нет ни одного браузера, где полностью реализована поддержка всех указанных форматов.

    Атрибут Значения Описание
    autoplay не указывается / autoplay
    controls не указывается / controls
    loop не указывается / loop
    muted не указывается / muted
    Формат IE 8 IE 9 Firefox 3.5 Opera 10.5 Chrome 10.0 Safari 3.0
    Ogg Vorbis Нет Нет Да Да Да Нет
    MP3 Нет Да Нет Нет Да Да
    Wav Нет Да Да Да Да Да

    Из таблицы видно, что только .wav поддерживается почти всеми браузерами, однако с точки зрения размера файла, это далеко не оптимальный вариант.

    Проблему кроссбраузерности можно решить, добавив несколько элементов source элементу , указав в качестве параметра, пути к одному аудиофайлу в различных форматах. Браузер воспроизведет первый поддерживаемый файл. Пример:

    В примерах, у тега присутствует атрибут controls, который добавляет управление аудио файлом (play, pause, volume). Помимо controls имеется ещё несколько атрибутов:

    src – собственно путь к воспроизводимому файлу;

    autoplay – воспроизведение файла при открытии страницы;

    loop — зацикливает воспроизведения трека.

    Это далеко не весь список, да и цели полностью описать работу данного элемента не ставилось.

    Хотелось ещё заметить, что в MaxSite CMS, на которой сейчас работает блог, нашелся не понятный баг — аудиофайлы не проигрываются, если пути к ним указывать в элементе source. По всей видимости элемент source где-то экранируется движком. Попробую разобраться, как будет время, а пока, для совместимости, размещаю аудиофайлы в формате wav.

    Если считаете статью полезной,
    не ленитесь ставить лайки и делиться с друзьями.

    HTML начало

    Как следует из предыдущей главы, HTML является языком разметки задача которого — просто «размечать» текстовый документ используя теги, которые, в свою очередь, говорят веб — браузеру, как именно нужно отобразить данный документ.

    Создание HTML документов

    Для того, чтобы создать HTML документ необходимо:

    1. Открыть любой текстовый редактор (например блокнот, Notepad++ и т.д.);
    2. Набрать произвольный текст и разметить его HTML тегами;
    3. Cохранить файл с расширением .htm или .html.

    Базовый документ HTML

    Ниже приведен в своей простейшей форме пример HTML-документа:

    Теперь вы можете воспользоваться кнопкой Попробуй сам, которая расположена в правом верхнем углу окна кода, для того, чтобы проверить результат этого HTML — кода, или сохраните код в HTML — файл test.html с помощью любого текстового редактора. И, наконец, откройте его с помощью веб — браузера, например Internet Explorer, Google Chrome или Firefox и т.д. Браузер должен показать следующий результат:

    HTML теги

    Как говорилось ранее, HTML это язык разметки, который использует различные теги для форматирования содержимого документа. Эти теги заключены в угловые скобки . За исключением нескольких тегов, большинство тегов имеют соответствующие им закрывающие теги. Например имеет свой закрывающий тег , а тег в свою очередь, имеет свой закрывающий тег

    Освоение HTML5 тега audio

    С появлением достаточно быстрого соединения с сетью Интернет, Flash был единственным инструментом для воспроизведения звуков на веб-сайтах. Но HTML5 в корне изменит способ воспроизведения звуков в Интернет. В этой статье я хочу подробно рассказать Вам о том, как использовать тег на ваших сайтах.

    Воспроизведение звука в цикле

    Различные форматы файлов

    Для старых браузеров

    Управление воспроизведением через JavaScript

    Читают сейчас

    Похожие публикации

    • 26 сентября 2011 в 12:04

    HTML5: старые теги нового назначения

    Проблемы с HTML5

    HTML5 Audio и Game Development: баги браузеров, проблемы и их решения, идеи

    Вакансии

    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Комментарии 19

    Используем audio для вставки звукового файлу на сторінку

    Для незнающих украинских — имеется в виду «на страницу»?

    И «файл wtkbrjv» — файл целиком :)

    Обратите внимание на атрибут autoload, который используется для автоматического воспроизведения звука. Тем не менее Вам не следует автоматически воспроизводить звуки а сайте, ведь это надоедает пользователям.

    так autoload или autoplay?

    >Safari, например, может проигрывать MP3, а Firefox не может, и играет OGG-файлы вместо этого.

    Ну вот опять начинается. Каждый браузер реализует свое, а фронтэндеры в итоге мучаются и держат на своей машине целый зоопарк.

    С появлением достаточно быстрого соединения с сетью Интернет, Flash был единственным инструментом для воспроизведения звуков на веб-сайтах.

    Никого не насторожило, что с 1-й строчки идёт неправда? Издревле альтернативами флешу были теги object и embed, которые работали напрямую с звуковыми файлами, сильно зависели от настроек ОС и установленных кодеков, но всегда были независимы от флеша. И никогда не исчезали из браузеров.

    Так вот, почему бы, даже если и перевод, не поправить автора сочинения? Как обычно, в скобках «прим. перев.». Зачем вообще переводить автора, не полностью разбирающегося в теме? Лучше взять правильную часть, проверить, если надо, и написать своими словами. Тем более, что в комментах уже пишут, что и данные теги работают с глюками, поэтому не могут быть решением.

    Возможно, я уже начитался кучи всего по и мне кажется эта информация просто убогой бесполезной, детской… Если в гугле набрать , то выдаст кучу ответов, где написано то же самое что и в этой статье… тогда — зачем переводить было?

    Вот это лучше бы перевели, если так сильно хотелось что-то сделать.

    Все легко: ниже приведён код, который будет отображать сообщение для браузеров, которые не поддерживают тег audio.

    У сервера неправильно прописан MIME тип для ogg (application/octet-stream), из-за этого Firefox не играет (в отличие от Оперы и Хрома). Может автор знает, как это исправить? Отредактировать .htaccess невозможно.

    Пробовал указывать тип в тегах — не помогает.

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Музыка и звуки на HTML-странице. Что такое HTML. Учебник по HTML.

    В данной главе вы ознакомитесь с основными принципами использования звука в компьютерах, необходимым программным и аппаратным обеспечением для воспроизведения звука. Узнаете, как настроить браузеры для приема и воспроизведения звука из сети Интернет.

    Будут рассмотрены подключаемые программные модули к браузерам, а также отдельные приложения, позволяющие воспроизводить все типы звуковых файлов. Вы узнаете об особенностях встраивания в HTML-документ звуковых файлов и использовании подключаемых модулей.

    Средства воспроизведения звука

    Еще совсем недавно единственным способом извлечения звуков при помощи компьютера было использование встроенного динамика, традиционно существовавшим на всех моделях персональных компьютеров. Хотя главным предназначением этого динамика была выдача коротких по длительности, чаще всего однотонных звуков, находились программисты, создававшие утилиты для воспроизведения целых музыкальных фрагментов.

    В наше время, когда термин «мультимедийный компьютер» стал привычным и уже не вызывает благоговейного трепета, большинство персональных компьютеров оснащаются звуковой картой и приводом для чтения компакт-дисков. Тем не менее, маленький динамик по-прежнему присутствует в каждом компьютере. За прошедшие годы компьютеры очень сильно изменились, в частности, отпала необходимость в некоторых устройствах и элементах конструкции. Так, например, современные компьютеры более не оснащаются кнопкой переключения режимов «Turbo», исчез замок для блокирования клавиатуры. Зато встроенный динамик все так же выполняет возложенные на него задачи.

    Не будет преувеличением сказать, что функционирование компьютера начинается со звука. Многие компьютеры при загрузке издают звуковой сигнал, по характеру которого можно определить правильность прохождения тестирования. Опытные пользователи даже при выключенном мониторе на слух могут определить корректность процесса запуска компьютера. Более того, до сих пор ряд программ используют возможности встроенного динамика для информирования пользователя, например, о завершении очередной фазы какого-либо процесса. Смысл этих рассуждений сводится к тому, что звуковая информация играла и играет весьма значительную роль в работе с компьютером.

    Для получения полноценного звука из компьютера нужна звуковая карта и колонки или наушники. За последние годы цена мультимедийных компонентов компьютера по отношению к общей цене значительно снизилась, что говорит о целесообразности их установки на компьютер. На сегодняшний день 8-битовые монофонические звуковые карты ушли в прошлое. Даже самые дешевые из них обеспечивают стереозвучание и работают в 16-битовом режиме. Установка звуковой карты вкупе с приводом чтения компакт-дисков превращает компьютер в музыкальный центр неплохого качества, а также обеспечивает возможность работы с мультимедийными программами. Вся информация, приводимая далее в этой главе, актуальна только для тех пользователей, компьютер которых оснащен звуковой картой.

    Как компьютер работает со звуком

    Существует два типа звуковых файлов, используемых в компьютерах: цифровые и музыкальные. Иногда выделяют еще один тип файлов — текстово-звуковые, в которых используется метод конвертирования текстового файла в звуки, близкие к человеческой речи, т. е. замена букв фонемами.

    Музыкальные файлы похожи на нотные листы, — мелодия в них хранится последовательностью музыкальных нот, и, кроме того, в них имеется информация об используемых для воспроизведения музыкальных инструментах. При проигрывании такой музыки звуковой адаптер может не просто генерировать звуки разной высоты, но и выбирать из памяти фрагменты звучаний реальных музыкальных инструментов и синтезировать мелодию. Использование таких звуков ограничено возможностями синтезатора.

    Большинство звуков, которых вы слышите из колонок компьютера, представляют собой оцифрованный звук. По своей сути оцифрованный звук довольно прост. Аналоговые по своей природе звуки, передаваемые по проводам в виде изменяющегося напряжения, преобразуются в цифровые данные, которые можно сохранять в компьютере в виде файлов. Такое преобразование выполняется при помощи аналого-цифрового преобразователя (АЦП). При воспроизведении выполняется обратное действие — преобразование из цифровой формы в аналоговую. Эта работа возлагается на звуковую карту компьютера. Пользователь может создать любое количество звуковых файлов, подключив к компьютеру микрофон или бытовой магнитофон и воспользовавшись стандартными программами записи звука.

    На качество получаемого оцифрованного звука влияет несколько факторов Важнейшим фактором является частота дискретизации звука (sampling rate ) или количество преобразований аналогового звука в цифровой (замеров), выполняемое за одну секунду. Чем больше частота дискретизации, тем выше качество звука и тем больше при воспроизведении он будет похож на оригинал. Обычно этот параметр лежит в диапазоне от 8 до 44,1 кГц. Увеличение частоты дискретизации приводит к пропорциональному росту размеров файла, поэтому здесь важен разумный компромисс.

    Другим фактором является разрядность дискретизации (sample rate), определяющая точность замеров. Типичными значениями являются 16 бит, 8 бит и др.

    Характеристикой звукового файла является также режим записи — моно или стерео. Выбор того или иного режима сразу же в два раза изменяет размер получаемого файла.

    Нетрудно подсчитать, сколько места на диске будут занимать оцифрованные звуки. Так, одна секунда фонограммы качества аудио CD (44100 замеров в секунду, 16 бит на канал, два канала) дает 172 Кб данных. Заметим, что полученная величина близка к скорости передачи данных односкоростных CD-приводов, большинство которых уже умели проигрывать аудиодиски. Сегодня скорости этих устройств значительно возросли, поэтому, тем более, проблем воспроизведения музыки не должно возникать.

    Выбор приведенных параметров оцифровки звука не случаен. Оказывается, что определить влияние факторов на качество звука довольно просто. Частота дискретизации определяет максимально возможную частоту воспроизведения звука. В соответствии с законом Найквиста, самая высокая частота воспроизведения равна половине частоты дискретизации. Так, при дискретизации 44,1 кГц звук можно воспроизводить с частотой 22,05 кГц. Такая частота с запасом перекрывает диапазон звуков, воспринимаемых большинством людей, и определяет практически идеальное качество. В то же время для передачи речи такой частоты, как правило, не требуется. Человеческая речь в основном укладывается в диапазон 3 кГц, поэтому в телефонных сетях оцифровка звука ведется на частоте 8 кГц.

    Разрядность дискретизации определяет фактор, представляющий собой отношение сигнала к шуму. Любой метод хранения и последующего воспроизведения звука вносит некоторые случайные потери, которые проявляются в виде шумов. Для оцифрованного звука шум определяется точностью замеров. Чем точнее измерение, тем меньше потенциальная возможность внесения шума.

    Еще одним фактором является наличие сжатия данных, целью которого является экономия места на диске и выигрыш во времени передачи файлов. Среди схем сжатия/хранения звуковых данных можно выделить схемы, обеспечивающие сжатие без потерь информации, а также схемы, позволяющие значительно (в 10 и более раз) уменьшить размеры файлов без заметного искажения звука. Подробное описание технологий хранения данных выходит за рамки этой книги, однако в конце главы все же будут даны некоторые практические рекомендации по работе с современными форматами звуковых данных, что вызвано необычайным ростом их популярности.

    Первые версии браузеров не имели встроенных средств для воспроизведения звука и, соответственно, на Web-страницах практически не встречалось звуковых файлов. Если же такие ссылки попадались, то сначала требовалось переписать файл на локальный диск, а затем воспользоваться внешней программой его воспроизведения. Технология подключаемых модулей изменила ситуацию. Теперь для браузеров имеется ряд подключаемых модулей, позволяющих воспроизводить звуковые файлы в различных форматах. Преимуществом использования подключаемых модулей по сравнению с внешними приложениями является возможность управления проигрыванием звуковых файлов прямо из окна браузера.

    Браузер Netscape поставляется вместе с подключаемым модулем LiveAudio, который часто называют «официальным» аудиоплейером Netscape. Модуль LiveAudio может работать со стандартными форматами AIFF, AU, MIDI и WAV. Этот модуль снабжен понятной и удобной консолью с кнопками воспроизведения, паузы, остановки и регулятором громкости.

    Модуль LiveAudio заменил вспомогательное приложение NAPlayer, сопровождавшего более ранние версии браузера Netscape Navigator. (Модуль LiveAudio начал поставляться с Netscape Navigator версии 3.0.)

    Приложение NAPlayer работало с форматами Sun/NeXT (AU и SND) и Mac/SGI (AIF и AIFF). LiveAudio имеет более широкие возможности и поддерживает следующие типы звуковых форматов:

      AIFF — формат звуковых файлов Mac/SGI

    AU — формат звуковых файлов Sun/NeXT

    MIDI— формат электронных музыкальных инструментов (Musical Instrument Digital Interface)

  • WAV — стандарт звуковых файлов операционной системы Windows
  • Формат AU когда-то был стандартным для Интернета. Формат AIFF — стандарт для платформы Macintosh, формат WAV — наиболее типичен в операционной системе Windows. Таким образом, этот подключаемый модуль может воспроизводить большинство стандартных оцифрованных звуковых файлов, а также работать с музыкальным форматом MIDI.

    Управление модулем LiveAudio

    Если на Web-странице, загружаемой браузером Netscape, встречается звуковой файл одного из перечисленных выше форматов, модуль LiveAudio выводит в окне браузера консоль управления. Вид консоли управления определяется параметрами, указанными в тэге включения звукового файла в страницу.

    Модуль может работать как со встроенными (с помощью тега ), так и отдельными звуковыми файлами (например, можно создать ссылку на звуковой файл). В последнем случае консоль управления выводится в пустом окне браузера, при этом сама консоль будет иметь стандартный вид.

    Органы управления модулем понятны и просты в использовании. Кнопки такие же, как и у обычного аудиоплейера — останов, воспроизведение, пауза и регулятор громкости, имеется простое выпадающее меню (рис. 7.1).

    Рис. 7.1. Консоль управления модуля LiveAudio

    Щелчком мыши слева или справа от ручки регулятора громкости можно уменьшить или увеличить громкость воспроизведения. Линейка «светодиодов» внизу показывает текущий уровень звука. Темно-зеленые «светодиоды» индицируют диапазон 0—40%, светло-зеленые — диапазон 40—100%.

    Если на консоли щелкнуть правой кнопкой мыши, будет выведено выпадающее меню. Его пункты дублируют кнопки управления, а также обеспечивают возможность сохранения звукового файла на локальном диске (Save As. ) и содержат сведения об изготовителе модуля (пункт меню About).

    Пункт меню сохранения файла (Save As. ) есть только в последней версии модуля LiveAudio (версия 1.1). В предыдущей версии этот пункт отсутствовал, зато отображалась информация о текущей громкости звука (например, появлялась надпись Current Volume: 60.0%).

    Встраивание звуковых файлов в Web-страницу

    Для использования звуковых файлов на Web-странице можно применить любой из двух вариантов: встраивать файл с помощью тега , либо создать ссылку на звуковой файл. В любом случае фонограмму можно будет прослушать при просмотре страницы в браузере Netscape при помощи подключаемого модуля LiveAudio. Первый вариант дает большую гибкость в компоновке страницы. Как будет описано ниже, тег обладает значительным количеством параметров, задавая которые можно контролировать аспекты работы модуля LiveAudio. Однако у этих возможностей есть и оборотная сторона. Если страница, рассчитанная на использование модуля LiveAudio, будет просматриваться другим браузером, который, вероятнее всего, будет иметь свои средства для воспроизведения звука, то все уникальные для модуля настройки не будут работать. Использование же ссылки на файл является стандартным способом, применяемым для любых типов файлов.

    В примере 7.1 приведен HTML-документ, в котором имеются встроенные файлы, а также есть ссылка на звуковой файл.

    Пример 7.1. Пример документа, использующего звуковые фрагменты

    Пример использования звуковых файлов

    Встраивание звукового файла

    с полным набором органов управления консоли

    Встраивание звукового файла

    с ограниченным набором органов управления консоли

    В документе, приведенном в примере 7.1, используются два встроенных звуковых файла (example1.wav и example2.wav), а также есть ссылка на звуковой файл example.mid. При просмотре этого документа в браузере Netscape для каждого из встроенных файлов будет отображена консоль управления модуля LiveAudio (рис. 7.2).

    Для файла example1.wav консоль управления будет иметь полный набор кнопок управления (этот режим используется по умолчанию), причем воспроизведение начнется автоматически при загрузке документа (AUTOSTART= TRUE) . Окно консоли управления будет иметь размеры 144 на 60 пикселов.

    Для звукового файла example2.wav консоль управления будет иметь более компактные размеры (144 на 15 пикселов) и урезанный набор органов управления, что определено инструкцией CONTROLS=SMALLCONSOLE. Воспроизведение этого файла начнется только в случае, если пользователь нажмет соответствующую кнопку.

    Размеры консоли органов управления модуля LiveAudio имеют постоянные значения и не могут изменяться (например, при полном наборе органов управления — 144 на 60 пикселов). Значения размеров окна, отводимых под встраиваемый элемент параметрами HEIGHT и WIDTH, не должны быть меньше требуемых. Если же этими параметрами заданы размеры больше требуемых, то справа и снизу от консоли управления будет оставлено соответствующее свободное место.

    Рис. 7.2. Отображение документа со встроенными звуковыми файлами в браузере Netscape

    На третий звуковой файл, используемый в документе (example.mid), дана стандартная ссылка. Реализация этой ссылки откроет новое окно браузера Netscape с полной консолью управления и автоматически запустит файл на воспроизведение (рис. 7.1).

    В табл. 7.1 перечислены параметры тега и их значения, использующиеся совместно с модулем LiveAudio. Все параметры необязательные, за исключением SRC, WIDTH и HEIGHT, применяющихся при встраивании в HTML-документ большинства объектов.

    Таблица 7.1. Параметры тега

    Указывает имя воспроизводимого файла (форматы AU, AIFF, AIF, WAV, MIDI и MID). Обязательный параметр

    Определяет ширину консоли в пикселах. Обязательный параметр

    Определяет высоту консоли в пикселах. Обязательный параметр

    AUTOSTART=
    TRUE | FALSE

    Если имеет значение TRUE, воспроизведение начинается автоматически. По умолчанию — значение FALSE

    AUTOLOAD=
    TRUE | FALSE

    Если имеет значение FALSE, файл не загружается автоматически. По умолчанию — значение TRUE

    Воспроизведение начинается с указанного в минутах и секундах момента от начала файла. По умолчанию — 00:00

    Воспроизведение оканчивается с указанного в минутах и секундах момента от начала файла. По умолчанию — это конец файла

    Громкость воспроизведения, указанная в процентах от максимальной. По умолчанию — последнее установленное значение

    Выравнивает консоль управления по отношению к тексту страницы. Может иметь значения CENTER, BASELINE, TOP, LEFT, RIGHT. По умолчанию — BASELINE

    Задает набор органов управления консоли. Может иметь следующие значения (они объяснены далее в этой таблице): CONSOLE, SMALLCONSOLE, PLAYBUTTON, PAUSEBUTTON, STOPBUTTON и VOLUMELEVER. По умолч анию — CONSOLE

    Полный набор органов управления

    Компактное представление консоли. Полный набор органов управления, кроме кнопки паузы

    Только кнопка воспроизведения

    Только кнопка паузы

    Только кнопка остановки. При этом файл выгружается

    Только регулятор громкости

    Комбинация органов управления, позволяющая включить в страницу несколько клипов. Например, можно указать CONSOLE=»MySetup» в двух тэгах одной страницы; при этом в обоих случаях вид консоли будет одинаковым

    Если для клипа задать параметры CONTROLS=»VOLUMELEVER» и CONSOLE= «_MASTERVOLUME», то изменение громкости звучания данного клипа будет отражаться на громкости всех остальных клипов, т. е. изменять громкость работы звуковой карты.

    Отображение документа, рассчитанного на определенный браузер, с помощью другого браузера может нарушить весь замысел автора. Посмотрим, как пример 7.2, будет выглядеть в браузере Microsoft Internet Explorer (рис. 7.3). Здесь для проигрывания встроенных звуковых файлов используется вспомогательное приложение Microsoft ActiveMovie, работающее как компонент браузера. Естественно, что это приложение не распознает большинства специфических параметров тега , рассчитанных на использование модуля LiveAudio браузера Netscape. В итоге, хотя оказывается вполне возможным прослушать все имеющиеся на странице звуковые файлы, внешний вид документа оставляет желать лучшего.

    Рис. 7.3. Отображение документа со встроенными звуковыми файлами в браузере Microsoft Internet Explorer

    Возможна и обратная ситуация. Документ, подготовленный с учетом требований браузера Internet Explorer, может неудачно отображаться браузером Netscape.

    Заметим, что приложение ActiveMovie предоставляет больше возможностей по управлению прослушиванием (рис. 7.4). Так, например, можно задать режим повторения фонограммы заранее заданное или бесконечное число раз. Есть возможность одновременного исполнения (с наложением звука) нескольких файлов встроенных на страницу, даже если они имеют одинаковый тип. Например, можно заставить играть два файла типа WAV одновременно, соорудив из браузера своего рода микшерский пульт. Этой возможности лишен модуль LiveAudio, в котором запуск одной фонограммы автоматически останавливает воспроизведение файла такого же типа. Исключением является возможность одновременного воспроизведения файла с оцифрованной музыкой и файла типа MIDI, что возможно всегда.

    Рис. 7.4. Консоль управления приложения ActiveMovie с полным набором кнопок

    Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами, то нужно сначала задать соответствующие MIME-типы. В табл. 7.2 перечислены MIME-типы и соответствующие им типы файлов, с которыми работает модуль LiveAudio.

    Таблица 7.2. MIME-типы и соответствующие им файлы

    Другие звуковые модули

    Кроме модуля LiveAudio, поставляемого с браузером Netscape, имеется довольно много других звуковых модулей, часть которых работает со своим, уникальным форматом хранения звука. Приведем краткую характеристику некоторых из них.

    В ряде случаев нет необходимости сохранять оцифрованный звук с параметрами, обеспечивающими качество звучания аудио CD. Напомним, что такое качество обеспечивается при частоте дискретизации 44,1 кГц, разрядностью 16 бит, стерео. Нетрудно подсчитать, что минута звучания потребует хранения около 10 Мб данных (44100×2 байтах2х60 = 10584000 байт). Записи такого качества сохраняют все оттенки звука, в частности, дают возможность воспроизведения всех высоких частот, слышимых человеческих ухом. Однако, для многих применений, например для передачи речевых сообщений, такое качество излишне. Для звуковых данных такого рода можно понизить объем хранимой информации, уменьшив характеристики оцифровки звука. Минимально возможными параметрами для хранения звука в стандартном формате WAV являются частота оцифровки 8 кГц, разрядность данных 8 бит, моно.

    Речь идет о хранении в подформате PCM, (Pulse Code Modulation, импульсно-кодовая модуляция), использующегося в большинстве случаев применения формата WAV. Этот подформат не предусматривает возможностей сжатия данных.

    При таких параметрах минута звучания уже потребует всего лишь около 0,5 Мб (8000x1x60 = 480000 байт). Выигрыш в 20 раз. Тем не менее, даже для такого звукового сообщения необходим поток 64 Кбит/с, что не дает возможности передавать данные по большинству модемов в реальном времени.

    Для решения этой задачи рядом компаний были разработаны модули, которые могут сохранять и воспроизводить звуковые сообщения со значительной степенью сжатия. Для речевых сообщений важнейшим фактором является разборчивость речи, которая сохраняется даже при сильном сжатии.

    К таким модулям относятся TrueSpeech, ToolVox, EchoSpeech и др.

    Модуль TrueSpeech компании DSP Group хранит звуки в своем собственном формате, сжимая данные до 60 Кб на одну минуту звучания (передача таких данных требует 8 Кбит/с). Поскольку в состав операционной системы Windows входит кодер/декодер для данного формата, то конвертировать оцифрованный звук в него можно при помощи стандартного приложения Фонограф (Sound Recorder). Более подробную информацию можно получить на сайте компании DSP Group: http://www.dspg.com/.

    Модуль ToolVox компании Voxware обеспечивает еще большую степень сжатия (до 53:1). После конвертирования речевого файла в формат VOX скорость потока данных сокращается до 2,4 Кбит/с. Для кодирования/декодирования данных используется кодировщик RT24, лицензию на использование которого получила компания Netscape. Появился также более новый кодер RT29, сокращающий поток данных до 2,9 Кбит/с. Компания Voxware ведет разработки программ для конвертирования текста в звуковые файлы и программ распознавания речи. Информацию о программном обеспечении, разрабатываемом компанией Voxware, можно получить на сайте: http://www.voxware.com/.

    Модуль EchoSpeech выполняет сжатие речи на частоте дискретизации 11025 Гц. Степень сжатия достигает значения 18.5:1, что уменьшает поток данных до 9,6 Кбит/с. Для создания файлов формата EchoSpeech нужно воспользоваться специальной программой -кодером Speech Coder. Программное обеспечение работы с файлами этого формата имеется по адресу http://www.echospeech.com/.

    Не стоит обольщаться, узнав о возможностях сжатия звука перечисленными выше программами. Запись любого музыкального произведения, сохраненного в этих форматах, будет звучать как со старой, заезженной пластинки.

    Существуют модули и для воспроизведения музыки в формате MIDI. Одним из наиболее известных среди них является модуль Crescendo компании LiveUpdate. При помощи браузера, оснащенного таким модулем, можно создавать Web-страницы с фоновыми музыкальными клипами и специальными звуковыми эффектами.

    Модуль запускается автоматически и работает без контрольной панели на экране. Модуль выпускается для систем Windows 95/NT и Macintosh и может быть скопирован со страницы http://www.Iiveupdate.com/midi.html.

    Усовершенствованная версия модуля, Crescendo Plus, имеет панель управления и поддерживает работу в реальном режиме времени, т. е. чтобы начать прослушивание, вам не надо ждать окончания загрузки звукового файла. Эту версию также можно найти на сайте компании LiveUpdate.

    Рис. 7.5. Web-страница, содержащая MIDI-файлы знаменитых рок-групп

    Формат электронных музыкальных инструментов MIDI вовсе не потерял своей популярности в связи с бурным развитием новых форматов хранения оцифрованного звука. До сих пор на Web-страницах встречается довольно много ссылок на файлы этого формата. Например, на сервере, посвященном трехсотлетию Санкт-Петербурга (1703—2003), можно услышать гимн города, хранящегося в формате MIDI. Кстати, этот сервер обещает быть очень интересным, его концепция, структура и наполнение определяются специальным наблюдательным советом, председателем которого является писатель Даниил Гранин. Содержание сервера (http://www.300.spb.ru) планируется обновлять вплоть до 2003 года.

    Встречаются целые сайты, посвященные музыкальным произведениям в формате MIDI (например, http://www.midi.ru). Множество страниц в Интернете посвящено дискографии различных музыкальных групп (например, http://rem.ifmo.ru/midi/, страничка этого сайта показана на рис. 7.5).

    С развитием возможностей Интернета актуальной стала задача проведения различных аудио- и видеоконференций, передачи вещания радиостанций в реальном времени. Технология RealAudio стала первой, предоставившей возможность передачи звуковых файлов в режиме реального времени. На сегодняшний день эта технология получила в Интернете широкое распространение, модуль RealAudio, несомненно, является самым популярным в Интернете приложением для вывода звуковых файлов. С сайта компании, разработавшей этот модуль, было скопировано несколько миллионов экземпляров плейера. В начале 1999 г. промелькнуло сообщение, что число зарегистрированных пользователей этой программы достигло 50 Мбиллионов.

    Разработка технологии RealAudio была выполнена компанией Progressive Networks (сейчас она называется RealNetworks). Компания в сети Интернет имеет свой сайт, популярность которого за последние годы необычайно увеличилась. Адрес сайта http://www.real.com.

    До недавнего времени сайт компании-разработчика технологии RealAudio имел адрес www.realaudio.com. Сейчас обращение по такому адресу приведет к странице www.real.com.

    RealAudio состоит из трех функционально связанных программ. Программа-кодировщик (RealProducer Pro) конвертирует готовые звуковые файлы или живой звук в файлы формата RealAudio. Программа-сервер (RealServer) передает эти файлы по сети. И, наконец, программа-плейер (RealPlayer G2) проигрывает файлы по мере их поступления на компьютер пользователя. Все три компонента доступны на сайте: http://www.real.com (рис. 7.6). Сайт содержит много полезной технической информации и звуковых примеров.

    Рис. 7.6. Сайт компании RealNetworks, посвященный технологии RealAudio

    Для прослушивания звуковых клипов достаточно иметь только программу-плейер RealPlayer. В случае если вы также планируете создавать свои собственные звуковые файлы и размещать их на сервере, необходимо иметь программу-кодировщик и программу-сервер.

    Ранние версии программы-плейера назывались RealAudio Player. Сегодня последняя версия программы называется RealPlayer G2. Эта программа является свободно распространяемой. Существует также коммерческая версия, имеющая название RealPlayer Plus G2. Коммерческая версия обладает несколько большими возможностями по сравнению с бесплатным вариантом. Различия в возможностях описаны в справочном файле, поставляемом вместе с программой.

    Исходными данными для кодирования в формат RealAudio являются готовые звуковые файлы, либо «живой» звук. Программа-кодировщик может создавать файлы, оптимизированные для модемов с различными скоростями. Типичными вариантами являются скорости 14,4 и 28,8 Кбит/с. В результате кодирования получается файл, размеры которого намного меньше размера исходного файла. Например, одноминутный файл формата WAV (частота 22 кГц, разрядность данных 16 бит, моно) занимает 2,6 Мб; кодированный файл формата RealAudio для скорости 14,4 составляет всего 60 Кб, а для скорости 28,8 — в два раза больше. Таким образом, достигается сжатие — 40:1 и 20:1 соответственно. Файл для скорости 14,4 по качеству сравним с АМ-вещанием и очень хорош для речи, а файл для скорости 28,8 звучит как монофоническая FM-передача и подходит практически для любой музыки.

    Процедура сжатия выполняет отбрасывание некоторой звуковой информации. Приходится пожертвовать качеством, чтобы получить выигрыш в скорости передачи. Это проявляется при прослушивании некоторой потерей глубины звучания.

    В Интернете информация может передаваться двумя способами. Одним вариантом является протокол TCP, лежащий в основе WWW, который подразумевает безошибочную передачу данных. Любая возникающая при передаче ошибка тут же исправляется повторной передачей. С другой стороны, существует протокол UDP, который подразумевает скоростную передачу с некоторыми потерями в точности. Наличие ошибок недопустимо, когда мы имеем дело с текстом или программным кодом, где важен каждый бит. Некоторые ошибки и неточности передачи звука воспринимаются нашим ухом как небольшой шум или статические разряды в процессе обычного радиоприема. При передаче звука более важна непрерывность передачи, здесь главное — не потерять целые блоки данных и поддерживать передачу в режиме реального времени. Поэтому сервер RealAudio использует протокол UDP. Возможен случайный пропуск того или другого звукового байта, зато звук передается непрерывно и в режиме реального времени.

    На самом деле в противоречии с названием технологии RealAudio передача радиопрограмм идет не совсем в реальном времени. Вещание различных серверов RealAudio обычно идет с некоторой задержкой, измеряемой минутами. С коллегой автора этих строк однажды приключилось следующее. Он зашел в комнату, где работало несколько компьютеров, на одном из которых шло вещание программы RealAudio. Связь была достаточно хорошая, что обеспечивало безупречную передачу звуковой программы. Поэтому определить на слух, идет ли настоящая радиопередача, пойманная из эфира радиоприемником, или же это программа RealAudio, не представлялось возможным. В некий момент в передаче прозвучали привычные сигналы точного времени. Как оказалось впоследствии, коллега, нисколько не сомневаясь в их правильности, автоматически взглянул на часы и, несколько удивившись их спешке, поставил точное время. В этот же день он чуть было не опоздал на поезд, так как программа RealAudio шла с почти десятиминутным запозданием.

    Сервер RealAudio является двухканальной системой: протокол UDP используется для передачи данных, а протокол TCP — для согласования с системой пользователя скорости передачи и трансляции команд.

    Программа-плейер RealPlayer Plus G2

    Программа воспроизведения клипов формата RealAudio выпускается для систем Windows, Macintosh и UNIX. Программа для Windows называется RealPlayer G2 и является свободно распространяемой. Коммерческая версия имеет название RealPlayer Plus G2. Установка любого варианта программы на компьютер не составляет труда. Программа поставляется в виде самораспаковывающегося файла, запустив который и, следуя дальнейшим указаниям, можно осуществить установку. В состав устанавливаемого пакета входит как самостоятельная программа-плейер, так и подключаемые модули для браузеров. После завершения установки браузеры Netscape и Internet Explorer получат возможность воспроизводить клипы формата RealAudio.

    Как самостоятельная программа RealPlayer Plus G2 (рис. 7.7) является полнофункциональным приложением, позволяющим воспроизводить звуковые файлы от любого источника, включая локальный диск или удаленный сервер. Эта программа является одним из представителей растущего числа приложений, способных напрямую, без участия браузера, общаться с Интернетом. Программа-плейер RealPlayer Plus G2 как отдельная программа может служить вспомогательным приложением браузера или самостоятельно воспроизводить звуковые файлы.

    Если в Web-страницу включается ссылка на файл формата RealAudio, то при щелчке мышью на ней браузер запустит программу-плейер как вспомогательное приложение. Это приложение работает как отдельная задача и после окончания прослушивания требует ручного закрытия.

    Если же файл встроен непосредственно в страницу с помощью тега , браузер автоматически отобразит на экране консоль управления подключаемого модуля.

    Органы управления плейера очень просты. Панель управления содержит типичный набор кнопок: Воспроизведение, Пауза, Останов, Запись (доступна только для коммерческой версии) и индикатор текущего момента проигрывания с бегунком. Имеется также кнопка включения эквалайзера (только для коммерческой версии) и кнопка переключения внешнего вида плейера (полный/компактный). Может выводиться информация о проигрываемом клипе, время воспроизведения и длительность клипа. Имеется движковый регулятор громкости. Конкретный внешний вид плейера в значительной степени зависит от установок, выбранных пользователем в пункте меню View. Заметим, что внешний вид, а также набор пунктов меню сильно изменились по сравнению с более ранними версиями программы, поэтому их детальное описание представляется излишним.

    Рис. 7.7. Программа-плейер RealPlayer Plus G2

    Если звуковой файл встраивается в страницу, то набор органов управления определяется автором страницы и зависит от значений параметров соответствующего тега . Правила записи параметров рассматриваются ниже.

    Встраивание в страницу звуковых файлов формата RealAudio


    Звуковые файлы, используемые технологией RealAudio, должны иметь расширение RA. Кроме того, принято использовать метафайлы с расширением RAM, которые представляют собой обычные текстовые файлы, каждая строчка которых содержит полный URL-адрес файла RA. Например:

    Такому файлу логично присвоить имя example.ram. Строчка pnm:// означает, что данные находятся на сервере RealAudio. Если на Web-страницах необходимо расположить ссылку на файл формата RealAudio, то обычно ссылаются на метафайл RAM, а не на сам файл RA, хотя это и не запрещено. Для чего так сделано? Метафайлы могут содержать целый список адресов файлов RA, которые будут воспроизводиться последовательно. Кроме того, в метафайлах могут располагаться сведения о моменте времени начала воспроизведения файлов, если требуется проигрывать их с определенного места.

    Для этого следует указать точку начала воспроизведения после адреса файла, отделив символом $:

    Полностью формат указания момента начала воспроизведения записывается следующим образом:

    где dd — дни, hh — часы, mm — минуты, ss — секунды и t — десятые доли секунды.

    Если вы хотите, чтобы при просмотре страницы использовался плейер как вспомогательное приложение, то достаточно лишь применить стандартную ссылку, например:

    Ссылка на метафайл

    Другим вариантом является встраивание с помощью тега , например:

    Обратите внимание, что при встраивании файлов для активизации подключаемого модуля, а не самостоятельного приложения, необходимо ссылаться на метафайл с расширением RPM, а не RAM. Никаких иных отличий, кроме расширения, правила записи метафайлов не имеют.

    Параметры WIDTH и HEIGHT указывают размеры окна для органов управления подключаемого модуля. Как и параметр SRC, они являются обязательными.

    Выбор значений размеров окна полностью определяется автором страницы. Подключаемый модуль построен таким образом, что его органы управления автоматически масштабируются по указанным размерам и, таким образом, всегда полностью занимают отводимое окно. В этом отличие, например, от модуля LiveAudio, описанного выше.

    Вот как выглядит обобщенный синтаксис тега , если он используется для встраивания файлов RealAudio:

    [CONTROLS=option] [AUTOSTART=True] [CONSOLE=value] [NOLABELS=True]>

    Параметры CONTROLS, AUTOSTART, NOLABELS и CONSOLE являются специфическими для RealAudio и могут отсутствовать.

    Параметр CONTROLS определяет набор органов управления модуля плейера RealAudio. В табл. 7.3 описаны возможные значения этого параметра.

    Таблица 7.3. Значения параметра CONTROLS

    Окно плейера содержит все органы управления, включая Control Panel, InfoVolumePanel и StatusBar. (Это значение используется по умолчанию)

    Окно плейера содержит кнопки воспроизведения, паузы, остановки, индикатор текущего положения и изображение регулятора громкости. (Аналог окна самостоятельного плейера, если не отмечена ни одна из опций меню View)

    Окно плейера содержит строки для вывода информации о файле и движковый регулятор громкости. (Аналог окна самостоятельного плейера, если отмечена опция Clip Info меню View)

    Окно плейера содержит строки для вывода информации о файле

    Окно плейера содержит строку состояния, указатели времени воспроизведения и длительности клипа. (Аналог окна самостоятельного плейера, если отмечена опция Status Bar меню View)

    Окно плейера содержит только кнопки воспроизведения и паузы

    Окно плейера содержит только кнопку остановки

    CONTROLS=VolumeSlider Окно плейера содержит только движковый регулятор громкости

    Окно плейера содержит только индикатор текущего положения

    Встраивает в строку состояния время воспроизведения и длительность клипа

    Встраивает в строку состояния текстовые сообщения

    Если параметру AUTOSTART присвоено значение TRUE, проигрывание файла начинается автоматически. Несколько файлов не могут звучать одновременно. Поэтому, если более одного тега имеют AUTOSTART=TRUE, только последний из них будет запущен автоматически. Порядок загрузки файлов зависит от программы-сервера и кэш-памяти браузера Netscape.

    Параметр CONSOLE позволяет создать несколько окон с различным набором органов управления, осуществляющими управление одним и тем же клипом. Изначально каждое окно связано со своим клипом; если же применить параметр CONSOLE, то предоставится возможность управлять одним клипом из различных окон. Например, запустить клип из одного окна, а остановить, пользуясь кнопками другого окна. Появляется возможность создания произвольного набора кнопок для отдельного клипа, расположенных также произвольным образом. Для реализации этого свойства следует указать одно и то же имя клипа в каждом из тегов , а также присвоить одинаковые значения параметру CONSOLE:

    Еще один пример на эту тему:

    Пример 7.2. Пример документа со встроенными файлами RealAudio

    Пример встраивания файлов формата RealAudio

    Различные варианты встраивания клипов формата RealAudio


    Кнопки воспроизведения/паузы, кнопка остановки
    и индикатор текущего положения


    Только панель управления


    Полный набор органов управления

    В примере 7.2 в HTML-документ встроено три клипа RealAudio и имеется ссылка на еще один файл. Отображение этого документа в браузере приведено на рис. 7.8. Первый из файлов sample1.rpm встраивается трижды с различным набором органов управления. Поскольку во всех этих тэгах есть строчка CONSOLE=clip1, то кнопки управления будут относиться к одному и тому же клипу. Например, запустив клип кнопкой воспроизведения, можно его остановить, нажав кнопку в другом окне (расположенном от него справа). По существу, все три окна, с точки зрения их функционирования, будут являться единой консолью управления для этого клипа. Естественно, что эти окна могли быть разбросаны по странице в произвольном порядке. При встраивании клипов RealAudio вид консоли управления определяется автором страницы.

    Рис. 7.8. Различные варианты встраивания клипов RealAudio

    Следующие два клипа иллюстрируют возможности встраивания консоли управления с различным набором кнопок.

    Файл sample1.rpm имеет следующее содержание:

    Остальные метафайлы имеют аналогичное содержание. Здесь для примера показано, что данные для плейера могут поступать не только от соответствующего сервера в реальном времени, а и представлять собой обычные файлы формата RA, расположенные локально.

    Продолжим рассмотрение значений параметров тега . Если параметру CONSOLE одного из тегов присвоить значение «master», то при запуске любого другого клипа на странице им можно управлять при помощи кнопок этого «главного» окна. Это удобно использовать, если вы, например, хотите, чтобы в странице было размещено несколько клипов с ограниченным набором органов управления, но при запуске любого из них иметь полный набор кнопок. Пример использования данного свойства приведен ниже.

    Пример 7 .3. Пример документа с мастер-консолью

    Встраивание нескольких клипов, управляемых одной консолью

    Альбом «The fat of the land»

    1.rpm W >

    Smack my bitch up 5:42

    Breathe 5:34

    Diesel power 4:17

    Funky shit 5:15

    Serial thrilla 5:10

    Mindf iels 5:39

    Narayan 9:04

    Firestarter 4:40

    Climbatize 6:36

    Fuel my fire 4 :18

    В приведенном примере встроено десять клипов, объединенных для удобства в таблицу. Каждый из встроенных клипов имеет минимальный набор кнопок управления: воспроизведения и паузы, что определяется параметром controls=PlayButton. Справа от таблицы (рис. 7.9) располагается еще одна консоль управления с полным набором кнопок, для которой указано значение console=»_master». Заметим, что для этого окна также имеется отдельный встроенный файл (empty.rpm), содержимое которого никогда не используется. Единственное, что необходимо, это обеспечить существование непустого файла с таким именем.

    Рис. 7.9. Несколько встроенных клипов, управляемых из одного окна

    Запуск на воспроизведение любого из десяти встроенных клипов приводит к активизации мастер-консоли. В этом окне будут отображаться все параметры запущенного клипа, а также будут работать все кнопки управления.

    Последним параметром тега является NOLABELS. Если ему присвоено значение TRUE, то вывод информации о клипе (название, автор и копирайт) будет запрещен.

    Для тех пользователей, браузеры которых не поддерживают тег , включите после этого тега контейнер с альтернативным содержанием:

    Что-то для браузеров, не поддерживающих подключаемые модули

    К примеру, можно такой строке дать ссылку для запуска самостоятельной программы-плейера:

    Несмотря на то, что все примеры встраивания файлов формата RealAudio приведены для браузера Netscape, они будут точно также работать и в браузере Internet Explorer. Это заслуга компании-разработчика плейера.

    Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами формата RealAudio, то нужно задать соответствующие MIME-типы. В табл. 7.4 перечислены MIME-типы и соответствующие им расширения файлов.

    Таблица 7.4. MIME-типы для RealAudio

    audio/x-pn-realaudio/plugin RPM

    Ресурсы RealAudio в Интернете

    Основным сайтом для получения разнообразной информации, связанной с технологией RealAudio, является официальный сайт разработчика этой технологии http://www.real.com.

    Информацию о передачах в формате RealAudio можно получить по адресу http://www.timecast.com. В недавнем прошлом это был отдельный сервер,

    однако, сейчас обращение по указанному адресу перебрасывается на страничку http://www.real.com/realguide/index.html.

    Появилось достаточное количество серверов RealAudio на русском языке. Их число постоянно растет, найти их адреса можно, воспользовавшись любой поисковой системой, например, по ключевому слову RealAudio. Укажем лишь некоторые из наиболее интересных адресов.

    Большой список серверов RealAudio, работающих на русском языке, можно найти по адресу http://www.guzei.com/radio/.

    Весьма обширная коллекция файлов в формате RealAudio располагается по адресу http://www.rus.org/mtrros/real/ (рис. 7.10).

    Рис. 7.10. Постоянно растущая коллекция песен на русском языке в формате RealAudio

    Не обошел вниманием возможности использования технологии RealAudio и известный российский Web-мастер Артемий Лебедев. В своем музыкальном разделе он расположил гимны всех республик бывшего СССР в этом формате для четырех разных скоростей соединений (рис. 7.11).

    Рис. 7.11. Музыкальный раздел с гимнами всех республик бывшего СССР

    Рис. 7.12. Страница радиостанции «Европа Плюс»

    Естественно, что возможности Интернета стали осваивать и ведущие российские радиостанции. Радиостанция «Маяк» является одной из старейших и наиболее известных в России. Пожалуй, нет в нашей стране ни одного человека, который бы ни разу не слышал ее позывных. Станция начала вещание 1 августа 1964 г. и с успехом продолжает его и сегодня. Начато вещание и в сети Интернет в формате RealAudio (http://www.radiomayak.ru/real/live.ram).

    Одной из наиболее популярных радиостанций, появившихся в последние годы, является станция «Европа Плюс». Она уже отметила свое 8-летие (основана в 1991 г.) и на сегодняшний день занимает второе место среди коммерческих радиостанций России. На рис. 7.12 показана страничка Санкт-Петербургского отделения радиостанции (http://www.europaplus.spb.ru). Как видно из рисунка, в планах компании осуществление вещания в формате RealAudio.

    Звуковые файлы формата MP3

    Как уже отмечалось в начале главы, хранение звуковых данных в оцифрованной форме с высоким качеством требует довольно больших затрат дисковой памяти. Попытки сократить объем файлов, используя стандартные архиваторы, обычно не приводят к значительному выигрышу из-за специфичности звуковых данных. Тем не менее, добиться довольно значительного уровня сжатия видео- и аудиоинформации удается при использовании специфических методов, основанных на анализе структуры данных и последующем сжатии с некоторыми потерями.

    Реальная возможность обработки изображений и звука, сравнимых по качеству с существовавшими аналоговыми примерами, появилась только в конце 80-х годов.

    В 1988 году Международной организацией стандартов ISO (International Standards Organization) был сформирован комитет MPEG (Moving Pictures Expert Group, группа экспертов в области движущихся изображений), основной задачей которого являлась разработка стандартов кодирования подвижных изображений, звука и их комбинации. За десять лет своего существования комитет выработал ряд стандартов по данному вопросу. В результате, обоб щив обширные исследования в этой области, был рекомендован определен ный набор методов сжатия аудио- и видеоданных. Был определен ряд специфических форматов для хранения данных, отличающихся по качеству ре зультатов и скорости передачи данных.

    В настоящее время существует три стандарта хранения видеоданных: MPEG-1, MPEG-2 и MPEG-4. В рамках форматов MPEG-1 и MPEG-2 существуют также форматы хранения звуковой информации, которые носят название Layer-1, Layer-2 и Layer-З. Эти три звуковых формата определены для MPEG-1 и незначительными расширениями используются в MPEG-2. Все три формата похожи друг на друга, но используют различные уровни компромисса между сжатием и сложностью. Уровень Layer-1 — наиболее простой, не требует значительных затрат на сжатие, но и дает небольшую степень сжатия. Уровень Layer-3 — наиболее трудоемкий и предлагает самое лучшее сжатие. В последнее время огромную популярность завоевал формат Layer-З, который часто называют просто MP3. Такое название связано с типичным расширением MP3 для звуковых файлов, хранящихся в этом формате. Это сокращение укоренилось, стало общепринятым, в частности, дало название ряду сайтов, посвященных этой технологии (www.mp3.com, mp3.box.sk, mp3soft.da.ru и др.).

    Основная идея, на которой основаны все методики сжатия аудиосигнала с потерями, — пренебрежение тонкими деталями звучания оригинала, лежащими вне пределов возможностей человеческого слуха. Здесь можно выделить несколько моментов.

    Уровень шума. Звуковое сжатие базируется на простом факте. Если человек находится рядом с громко воющей сиреной, то вряд ли он услышит разговор стоящих неподалеку людей. Причем это происходит не оттого, что человек обращает больше внимание на громкий звук, а в большей степени оттого, что человеческое ухо фактически теряет звуки, лежащие в том же диапазоне часто, что и значительно более громкий звук. Этот эффект носит название маскирующего, он изменяется с различием в громкости и частоте звука.

    Одним из основных способов сжатия звука является уменьшение числа бит, используемых для хранения данных при дискретизации звука. Уменьшение числа бит эквивалентно добавления шума к звуку. Сжатие MPEG использует маскирующий эффект, имея в виду, что человек все равно не услышит появляющийся в результате уменьшения числа бит шум.

    Вторым моментом является деление полосы звуковых частот на подполосы. Каждая из выбранных подполос далее обрабатывается отдельно. Программа кодирования выделяет самые громкие звуки в каждой подпол осе и использует эту информацию для определения приемлемого уровня шума для этой подполосы. Лучшие программы кодирования учитывают также влияние соседних полос. Очень громкий звук в одной подпол осе может повлиять на маскирующий эффект и на близлежащие полосы.

    Еще одним моментом кодирования является использование психоакустической модели, опирающейся на особенности человеческого восприятия звука. Сжатие с использованием этой модели основано на удалении заведомо не слышимых частот с более тщательным сохранением звуков, хорошо различаемых человеческим ухом. К сожалению, здесь не может быть точных математических формул. Восприятие звука человеком — сложный, до конца не исследованный процесс, поэтому выбор методов сжатия выполняется на основе анализа прослушивания и сравнения по-разному сжатых звуков группами экспертов. Зато здесь имеются практически неограниченные возможности в сфере улучшения психоакустических моделей.

    Большинство существующих алгоритмов для кодировки человеческого голоса основано на высокой степени предсказуемости такого сигнала — универсальные алгоритмы сжатия MPEG с переменным успехом пытаются применить этот прием. Еще одним приемом сжатия является использование так называемого совмещенного стерео. Известно, что слуховой аппарат человека может определить направление лишь средних частот — высокие и низкие звучат как бы отдельно от источника. Значит, эти фоновые частоты можно кодировать в моно сигнал.

    Кроме всего этого для сжатия используется различие в сложности потоков в каналах. Например, если в правом канале какое-то время полная тишина, это «зарезервированное» место используется для повышения качества левого канала или туда впихиваются необходимые биты, не влезшие в поток чуть раньше.

    На последней стадии сжатия используется алгоритм сжатия Хаффмана, используемый во многих стандартных программах сжатия. Этот процесс позволяет улучшить степень сжатия для относительно однородных сигналов, которые плохо сжимаются с помощью описанных выше приемов.

    На основе описанных идей строятся алгоритмы сжатия, позволяющие достичь степени компрессии 10:1 и выше практически без потери в качестве звучания. При кодировании задают требуемый уровень компрессии, а алгоритмы сжатия добиваются требуемого уровня сжатия за счет качества. Для данного применения требуемый уровень сжатия обычно указывают в виде величины потока данных (bit rate), измеряемого в Кбит/с.

    Термин «bit rate» обозначает количество битов передаваемой информации в секунду. На русский язык этот термин переводится по-разному в различных источниках. В последнее время часто вместо формального перевода употребляют новое для русского языка слово «битрейт». Вариантами перевода также являются следующие: «ширина потока данных», «сложность потока битов», «скорость потока», «битовая частота». Иногда для звуковых файлов этот же параметр называют степенью сжатия файла. Например, говорят, что файл сжат до 128 Кбит/с. Дело в том, что величина битрейта напрямую связана с размером звукового файла в расчете на одну секунду звучания (уменьшение размера файла в определенное количество раз обеспечивает снижение битрейта в такое же количество раз).

    Воспроизведение файлов формата MP3

    Для проигрывания файлов MP3 существует довольно большое количество программ-плейеров, число которых измеряется десятками. Большой список таких программ можно найти на сайте http://www.dailymp3.com. Однако среди перечисленных программ есть всего несколько, пользующихся огромной популярностью и занимающих практически весь рынок программ. Безусловным лидером является программа Winamp, обсуждение которой будет дано ниже. Дальнейшему росту популярности программы Winamp будет способствовать ее включение в дистрибутив пакета Netscape Communicator версии 4.7.

    Программы воспроизведения отличаются друг от друга как интерфейсом, так и такими важными параметрами, как качество проигрывания и скорость декодирования. По скорости декодирования самым быстрым плейером был и остается на сегодняшний день K-Jofol, краткие характеристики которого также будут приведены ниже.

    Вопрос качества воспроизведения не так прост, как может показаться. Несмотря на то, что стандарт MP3 однозначно определяет, какие именно данные содержатся в MP3-файле, это не значит, что их декодирование обязательно должно быть однозначным. Причин неоднозначности несколько. Во-первых, независимо от сути алгоритма декодирования, оно может проводиться с разной точностью. По данному признаку декодеры разделяют на 32-битовые и 64-битовые. Существует также 110-битовый декодер NAD.

    Во-вторых, как и в случае с цифровыми данными, записанными на CD, содержащаяся в файлах информация является лишь приближением к исходному сигналу. И как для более адекватного воспроизведения аудио CD с компенсацией дефектов, вызванных записью на CD, в высококлассной аппаратуре применяются различные методы обработки звука, так и в случае файлов MP3 в принципе можно значительно улучшить звучание, если знать, какие из вносимых сжатием в MP3 искажений более заметны и какие поддаются коррекции.

    По качеству звука лидером считается программа NAD, возрождающаяся ныне под названием NADDY (http://ae.dmusic.com).

    Установка программы Winamp

    Программа-плейер Winamp (Windows Audio Mpeg Player) предназначена для воспроизведения звуковых файлов в различных форматах (MP3, WAV, MIDI и др.) и может устанавливаться в среде Windows 95/98/NT. Для качественного воспроизведения файлов MP3 минимальным требованием является компьютер на базе процессора 486 последних моделей. Рекомендуется использовать Pentium и выше. Программа разработана компанией Nullsoft (http://www.nullsoft.com), для получения сведений о новейших разработках можно обратиться к официальному сайту http://www.winamp.com. Совсем недавно появился сайт http://www.winamp.ru, на котором будет дублироваться информация официального сайта на русском языке.

    Инсталляция программы на компьютер в среде Windows очень проста. Инсталляционный файл программы представляет собой исполняемый файл (ЕХЕ-файл) размером порядка 500 Кб (для популярной в свое время версии 2.05).

    Последующие версии имеют незначительно отличающийся размер инсталляционного файла. Правда, начиная с версии 2.24, компания-разработчик стала предлагать программу в двух вариантах— базовом и полном. Базовый комплект в отличие от полного не имеет некоторых возможностей, которые на самом деле не нужны для обычного прослушивания звуковых файлов, поэтому вполне годится для типичного применения программы. Размер базового комплекта версии 2.5с составляет примерно 600 Кб, а полного комплекта той же версии — 1,8 Мб.

    Запустите этот файл на исполнение, и вы увидите окно, как на рис. 7.13.

    Выберите имя каталога, в который необходимо установить программу и нажмите кнопку Install. Появится окно (рис. 7.14), в котором предлагается обновить список ссылок на ресурсы программы Winamp в сети Интернет. Если ваш компьютер подключен к Интернету, нажмите кнопку Да, в противном случае нажимайте Нет.

    Рис. 7.13. Окно инсталлятора программы Winamp

    Рис. 7.14. Окно запроса обновления динамических ссылок

    После этих действий программа автоматически запустится в режиме воспроизведения демонстрационного файла формата MP3 (demo.mp3). На этом установка будет завершена.

    Заметим, что на настоящий момент существует довольно много версий программы. Новые версии программы Winamp в отдельные моменты появлялись чуть ли не каждую неделю (табл. 7.5, в этой таблице приведен далеко не исчерпывающий список версий). Это, с одной стороны, свидетельствует о том, что разработчики программы активно работают над ее модернизацией. С другой стороны, скоропалительный выпуск новых версий не позволяет тщательно отлаживать программу. В итоге выпуск новой версии таит в себе и новые ошибки, исправляемые в последующих версиях. В частности, для версии 2.09 авторам пришлось буквально через два дня выпустить файл-заплатку (patch), которая исправляет допущенные ошибки и изменяет номер версии на 2.091. Разные версии программы имеют и определенные возможности и особенности, зачастую не описываемые разработчиками. Основные возможности различных версий можно всегда посмотреть на сайте компании-разработчика, а также в справочном текстовом файле, появляющемся в каталоге при установке программы. Пользователю обычно не интересно изучать нюансы версий программы, однако полезно знать основные особенности и рекомендации по использованию, так как с программами различных версий приходится сталкиваться в различных архивах и на CD-дисках с музыкальными файлами. Активные пользователи по возможности стремятся устанавливать последнюю версию, считая, что она, по крайней мере, не хуже, что для данной программы не всегда справедливо.

    Отметим лишь важнейшие и наиболее интересные особенности версий. Версия 1.92 ознаменовала рождение нового поколения программы Winamp, включив в себя новый декодер Nitrane 1.0, обеспечивающий поддержку технологий ММХ и 3DNow! Декодер Nitrane использовался во многих последующих версиях программы, однако в версии 2.20 был заменен на другой декодер, лицензированный немецким институтом Fraunhofer IIS (о вкладе этой организации в развитие технологий кодирования звука см. ниже в этой главе). Этот декодер использовался в версиях 2.20-2.22. Естественно, что при выходе этих версий говорилось, что программа оснащена новым декодером, улучшившим качество звука. При этом лишь кое-где мельком упоминалось, что этот декодер работает лишь с форматом звука Layer-З, а форматы Layer- 1 и Layer-2 корректно не воспроизводит. Незнание этой особенности программы оказалось очень неприятным. Дело в том, что в настоящее врем я большинство звуковых файлов MPEG записываются в формате Layer-З, однако встречаются и старые записи Layer-1 и Layer-2. Причем довольно ча ст о в фонотеках все файлы независимо от формата имеют расширение MP3 . Отличить формат файла по расширению становится невозможно. Это можно сделать лишь посмотрев информацию самого музыкального файла (View file info). Что же происходит в итоге. Установив новую версию программ ы в определенный момент обнаруживаешь, что некоторые звуковые файлы , прекрасно воспроизводившиеся предыдущими версиями программы, перестали корректно воспроизводиться новой версией по непонятным причинам. Такая ситуация весьма неприятна для пользователя и весьма подрывае т авторитет компании-разработчика. Данный декодер использовался лишь в трех версиях программы, и в версии 2.23 разработчики вновь вернулис ь к декодеру Nitrane обновленной версии 1.60. Возвращение декодера Nitrane сопровождалось рекламными характеристиками об уменьшении загруз ки процессора при декодировании файлов, появилась даже фраза «Nitrane жив!» . Все эти изменения обросли легендами и мифами, в которых правда соседствует с вымыслом. Так возврат к декодеру Nitrane был обыгран следующ им образом. Было сказано, что автор программы Winamp Дж. Френкель разби л свой автомобиль Audi и после случившегося потерял всякое доверие к немецкой инженерии, что и послужило поводом для возврата к собственному декодеру Nitrane. Косвенным доказательством реальности случившегося может служить фотография разбитого автомобиля, файл с которой можно найти на просторах Интернета. В других источниках указывалось, что в течение некоторого времени происходила судебная тяжба между компанией Nullsoft и неким истцом, в продолжение которой компании Nullsoft было запрещено использовать собственный декодер. По окончании тяжбы все встало на свои места. Как все происходило на самом деле, обычному пользователю совершенно не интересно. Эти подробности приведены лишь для того, чтобы показать разнообразие возможных мотивов изменения характеристик программ и их неожиданное влияние на потребительские качества.

    Отметим еще некоторые возможности различных версий. Возможность локализации программы Winamp была заложена довольно давно, однако лишь летом 1999 г. появился модуль русификации (Language Pack). Файл для русификации имеет имя Russian.Ing и существует в трех вариантах — для версии 2.10, группы версий 2.2х и версии 2.5х.

    Программа Winamp распространялась по принципу shareware, подразумевающему двухнедельный оценочный период и последующую регистрацию программы с небольшой оплатой (см. рис. 7.13). К чести разработчиков программы следует заметить, что не было сделано никаких ограничений к использованию программы после прохождения двухнедельного срока после ее установки. Более того, начиная с версии 2.50, программа стала полностью бесплатной (freeware).

    Таблица 7.5. Версии программы Winamp

    23 2.21 12.05.99 24 2.22 26.05.99 25 2.23 08.06.99 26 2.24 13.07.99

    Довольно популярной долгое время была версия 2.05, которая работае т весьма устойчиво. Начиная с версии 2.06, программа Winamp была переписана на Visual C++. По утверждению авторов программа должна была стат ь меньше по размерам и работать надежнее.

    Управление программой Winamp

    Работа с программой проигрывания звуковых файлов Winamp не вызывае т затруднений. Вы выделяете необходимые звуковые файлы и кидаете и х (drag-and-drop) в любое место окна программы Winamp. Файлы попадают в список проигрываемых файлов и буду т воспроизводиться по очереди. Это наиболее простой способ использовани я программы.

    Внешний вид программы с графически м эквалайзером (Winamp Equalizer) и списком проигрываемых файлов (Winamp Playlist) показан на рис. 7.15. Заметим , что на рисунке показано одновременно три окна: самой программы, эквалайзер а и списка файлов. Эти окна могут быт ь разбросаны по экрану, а могут быть составлены в произвольном порядке др уг над другом и перемещаться как едино е целое.

    Рис. 7.15. Окна программы Winamp

    Окошко самой программы имеет следующие кнопки управления (нижний ряд кнопок): переход к предыдущему звуковому файлу из списка (Previous Track), воспроизведение (Play), пауза (Pause), останов (Stop), переход к следующему звуковому файлу из списка (Next Track), выбор нового файла или файлов (Eject (open file (s))). В этом же ряду имеются две кнопки-переключателя: Shuffle и Repeat, а также кнопка About. Если включена кнопка Shuffle, то воспроизведение файлов из списка будет выполняться в случайном порядке, в противном случае они будут проигрываться подряд. Включение кнопки Repeat обеспечивает бесконечный цикл воспроизведения.

    Выше ряда кнопок управления располагается ползунок, перемещающийся по мере исполнения произведения. Перемещая ползунок, можно обеспечить воспроизведение файла с любого места.

    Еще выше располагаются ползунки управления громкостью звука и балансом. Тут же расположены кнопки включения/выключения окон эквалайзера (EQ) и списка файлов (PL).

    В окне программы Winamp отображается также информация о воспроизводимом в текущий момент файле. Указывается битрейт файла (например, 128 Кбит/с), частота оцифровки (например, 44 кГц), режим воспроизведения (моно или стерео).

    Двойным щелчком по строчке с информацией о текущей фонограмме можно вызвать редактор идентификационных параметров звукового файла (рис. 7.16). В окошках редактора можно увидеть данные, хранящиеся в файле, и при необходимости их отредактировать. Заметим, что программа Winamp даже в нерусифицированном виде ограниченно поддерживает русские буквы.

    Рис. 7.16. Окно редактора параметров звукового файла программы Winamp

    Подключаемые модули программы Winamp

    Возможности программы Winamp можно существенно расширить при помощи технологии подключаемых модулей (plug-ins). Подключаемые модули представляют собой дополнительные, специально разработанные программы, которые присоединяются к Winamp и работают совместно с ней. Это может быть программа, которая выводит (под музыку) на экран монитора какую-нибудь графическую информацию (модули визуализации), программа, добавляющая звуковые эффекты (модули DSP — Digital Sound Processing, цифровая обработка звука), или модули общего назначения (General Purpose plug-ins) — например, добавляют кнопки управления проигрывателем в панель задач. Существуют специальные модули для открытия нестандартных типов файлов, например VQF-файлов, а также модули для вывода звука через нестандартные устройства (например, при переводе звука из формата MP3 в формат WAV).

    Начиная с версии 2.09 в файл с дистрибутивом программы Winamp более не включаются подключаемые модули (plugins) для визуализации и обработки звука (vis/dsp). Теперь их необходимо скачивать и устанавливать отдельно. Разумеется, все ранее установленные модули сохраняются, если новая версия программы устанавливается поверх предыдущей.

    Установка модулей не представляет сложностей. В простейшем варианте подключаемые модули представляют собой небольшие dll-файлы, начало имени которых отражает их назначение (vis — модуль визуализации, dsp — модуль обработки звука, gen — модуль общего назначения, in/out для ввода/вывода). Как правило, модули хранятся в упакованном виде. Необходимо распаковать архив в каталог \Winamp\Plugins\.

    Затем запустите Winamp и настройте модуль. Для этого откройте окно Preferences ( +

    ), выберите соответствующий модуль и выполните его настройки.

    Подключаемые модули программы Winamp можно найти на различных сайтах сети Интернет. В частности, около сотни разнообразных модулей имеется на официальном сайте http://www.winamp.com.

    Одним из наиболее интересных модулей визуализации является модуль Cthugha, реализующий огромное количество светомузыкальных эффектов (рис. 7.17).

    Рис. 7.17. Окно модуля визуализации Cthugha

    Информацию о модуле Cthugha можно получить на следующих сайтах: http://www.afn.org/

    Изменение внешнего вида программы Winamp

    В программе Winamp для изменения внешнего вида любого окошка можно воспользоваться технологией установки так называемых Scin’ов. Изображения главного окна проигрывателя, всех кнопок, регуляторов, букв хранятся в отдельных графических BMP-файлах, которые легко редактируются. Это позволяет изменять внешний вид программы по своему усмотрению. Набор таких файлов называется Scin’ом. Слово skin в переводе с английского языка означает кожа, шкура, кожура. Для данного применения этого термина пока не найдено удачного перевода, верно отражающего смысл. Часто употребляется без перевода, например, говорят «установить новый скин». Встречаются термины «сменить шкуру», «установить обшивку». Как бы это ни называли, речь идет об изменении внешнего вида окошек программы Winamp, которое никак не влияет ни на расположение элементов окон, ни на функциональные возможности программы.

    Рис. 7.18. Сайт www.winamp.com, целиком посвященный программе Winamp

    Технология использования Skin’ ов, как это ни удивительно, получила очень широкое распространение. В сети Интернет можно найти огромное количество разнообразных Scin’ов для Winamp, даже найти целые коллекции, в которых они разбиты по отдельным рубрикам. Достаточно зайти на специальный сайт (рис. 7.18), посвященный программе Winamp (http://www.winamp.com), и скачать оттуда любой из имеющихся Scin’ов, число которых перевалило за тысячу на начало 1999 г. и за три тысячи еще через полгода.

    Установить новый Skin довольно просто. Сделайте подкаталог в каталоге \Winamp\Skins\ с именем, соответствующим названию Skin’a. Разархивируйте туда содержимое архива со Scin’ом. Отдельный Skin представляет собой набор примерно десяти файлов с расширением BMP и как минимум одного текстового файла. Некоторые Scin’ы имеют встроенные подключаемые модули (файлы *.DLL), которые нужно скопировать в каталог \Winamp\Plugins\.

    После совершения этих операций нажмите в главном окне проигрывателя Alt-S. Появится Skin Browser, где можно опробовать новый Skin.

    На рис. 7.19 показаны примеры Scin’ов, изменяющих внешний вид основного окна программы Winamp.

    Рис. 7.19. Различные варианты отображения основного окна программы Winamp

    Скрытые возможности программы Winamp

    Многие программисты закладывают в свои программные продукты некоторые недокументируемые возможности. Иногда это требуется для отладочных, проверочных и других технологических целей. В ряде случаев авторы программ закладывают в них различные шутки («приколы», как говорят программисты), не влияющие на возможности программ. К последним относятся и несколько скрытых возможностей программы Winamp версии 2.хх.

    Откройте окно About Winamp, выберите вкладку Winamp (рис. 7.20). На рисунке вы увидите стилизованное изображение любителя музыки в наушниках, перемещающееся по экрану. Однако, если, находясь на этой вкладке, вы выполните двойной щелчок мышью на слове Copyright, одновременно удерживая клавиши ++ , то увидите фотографию главного программиста фирмы Nullsoft Джастина Френкеля (Justin Frankel).

    Рис. 7.20. Вкладка Shareware окна About Winamp программы Winamp

      Откройте окно About Winamp, выберите вкладку Shareware (рис. 7.21). Вы увидите информацию об использовании вами программы, в частности, количество запусков программы, число исполненных произведений и общее число минут воспроизведения. Это полезная статистическая информация. Попробуйте сделать двойной щелчок мышью на строчке Usage statistics. Появится строчка, извещающая о том, сколько дней на сегодня прожил автор программы.

  • Выберите стандартный внешний вид (skin) программы Winamp. На клавиатуре медленно наберите слово nullsoft, нажимая клавишу после каждой буквы. Вместо названия окна программы Winamp появится строчка текста, которая, в частности, озвучена в демонстрационном файле demo.mp3. Перевод текста оставляем читателю.
  • Рис. 7.21. Программа Winamp накапливает статистику своего использования

    Декодирование файлов формата MP3

    Для декодирования звуковых файлов формата MP3 и их сохранения, например, в формате WAV можно воспользоваться специальными программами-декодерами. Однако многие программы-проигрыватели файлов MP3 обладают возможностью такого преобразования. В частности, таким свойством обладает программа Winamp.

    Для того чтобы преобразовать звуковой файл MP3 в формат WAV необходимо сделать следующее.

      В меню Options/Preferences выберите вкладку Audio I/O.

    В окне Output Plug-Ins выберите строчку Nullsoft Disk Writer Plug-In. (рис. 7.22).

    Нажмите кнопку Configure и выберите имя каталога, в котором будут сохраняться создаваемые файлы.

  • Запустите режим воспроизведения. Вместо воспроизведения звука будут создаваться файлы формата WAV.
  • Рис. 7.22. Вкладка Audio I/O окна Winamp/Preferences

    Программа Winamp сохраняет сделанные вами настройки. Если в следующий раз вы захотите прослушать фонограмму вместо преобразования файла, то нужно не забыть вернуться к исходным установкам. Процесс преобразования внешне выглядит точно так же, как и воспроизведения. Даже модули визуализации в процессе преобразования будут работать, однако звука не будет слышно.

    Где найти файлы MP3?

    В последнее время хранение музыкальных записей в формате MP3 получило очень широкое распространение. В сети Интернет уже существует довольно большое количество сайтов, посвященных коллекциям фонограмм в этом формате, причем их число постоянно растет. Найти сайты не представляет труда, воспользовавшись любой поисковой системой. Для этого достаточно для поиска ввести ключевое слово «MP3». Заметим, что таким же образом можно найти и коллекции в других форматах, описанных ниже (например, VQF). Что же касается нового формата хранения звука МР4, то о нем пока ничего не слышно, поэтому поиск по ключу «МР4» приведет к чему угодно, но не к музыкальным сайтам. Приведем адреса лишь некоторых наиболее интересных сайтов.

    На рис. 7.23 показана одна из страничек сети Интернет, посвященная музыке (http://www.omen.orc.ru/fl8.htm).

    Рис. 7.23. Одна из многочисленных русскоязычных страничек, посвященных музыкальным ресурсам в сети Интернет

    Рис. 7.24. Официальный сайт фонда В. Высоцкого

    Множество сайтов на русском языке посвящено авторской песне, в частности, отдельным исполнителям. Например, можно найти страничку, целиком посвященную В. Высоцкому (рис. 7.24). Адрес сайта http://kulichki.rambler.ru/masha/vysotsky.

    Приведем список некоторых наиболее известных русскоязычных сайтов с музыкальными коллекциями:

    Создание звуковых файлов MP3

    Оказывается, что создать звуковые файлы формата MP3 может практически каждый в домашних условиях. Для этого необходимо иметь источник аудиоданных (обычно это аудио CD) и пару программ.

    Создание файла выполняется в два почти независимых этапа. На первом этапе следует получить файл формата WAV (стандартного звукового файла Microsoft Windows), а на втором этапе выполнить его кодирование в формат MP3. Эти этапы можно проделать непосредственно друг за другом, но можно и разделить промежутком времени. Что они в себя включают?

    Входным источником для большинства программ-кодировщиков служат WAV-файлы. Некоторые из кодировщиков (для UNIX и OS Macintosh) поддерживают и другие входные форматы. Информация же на CD содержится в специфическом «звуковом» формате в соответствии со стандартом ISO-9680 для записи аудио CD. Перед кодировкой необходимо вычленить такой WAV-файл, что и является первым этапом. Для считывания музыки с аудио CD можно, конечно, прогнать звук через звуковую карту и, воспользовавшись каким-либо звуковым редактором, сохранить данные в виде WAV-файла. Однако это наихудший путь для вычленения звука. Кроме музыки будет сохранен весь набор шумов, который только может породить звуковая карта. Использование звуковой карты оправдано только для тех случаев, когда нет возможности взять музыку непосредственно с CD, например, при записи с радио, магнитофона и т. д. Для считывания музыки с CD пользуются специальными программами, способными перевести данные из аудиоформата в WAV-файл без использования звуковой карты. Такие программы носят название «рипперы» (rippers). В переводе на русский язык для их обозначения используются также термины «нарезальщик», «сдиратель», «грабилка» и др. В последнее время таких программ появилось довольно много, причем cреди них есть условно-бесплатные и вовсе бесплатные. Их обилие определяется в основном тем, что каждая программа поддерживает определенный набор моделей CD, с которым можно ознакомиться в описании программы.

    Заметим, что далеко не все приводы компакт-дисков поддерживают операцию чтения аудиодорожек (Reading raw audio stream). Для выбора программы-риппера, просмотрите таблицу, приведенную в приложении 3, и определите главное: поддерживает ли вообще ваша модель CD-ROM такое считывание, и если да, то каким из нарезальщиков рекомендуется пользоваться.

    Программы вычленения файлов с аудио CD

    Одной из наиболее популярных программ-рипперов является WinDAC (Windows Digital Audio Copy). Эта программа поддерживает большое количество приводов CD-ROM, в частности все модели с интерфейсом SCSI. По адресу http://www.windac.de/ можно получить полную версию программы.

    Второе место по популярности занимает программа AudioGrabber. Эта программа не умеет работать с драйверами SCSI, однако прекрасно работает с устройствами интерфейса IDE. Информацию о программе можно получить по адресам http://www.audiograbber.com-us.net, http://audiograbber.da.ru/.

    Менее популярной является программа CDCopy, работающая в Windows (http://www.cdcopy.sk/). Среди программ, работающих в среде DOS, следует упомянуть CDDA (CD Digital Audio) и CD2WAV.

    Информацию о работе с этими программами можно получить на сайтах http://www.mp3.com, http://www.multimania.com. Из русскоязычных сайтов можно рекомендовать обратиться к страничке http://members.xoom.com/kandid/.

    Остановимся теперь на программах-кодировщиках. Эти программы на входе принимают WAV-файл и выполняют его кодирование в формат MP3. Часть программ позволяет работать из командной строки, что дает возможность выполнять их запуск непосредственно из программ-рипперов после считывания очередного трека. Такой возможностью, например, обладает программа-риппер WinDAC, которая имеет механизм написания и запуска скриптов. Некоторые из программ-кодировщиков могут принимать поток данных, поступающих от программы-риппера, и кодировать его без создания промежуточных WAV-файлов. Появились также программы, представляющие собой объединение кодировщика вместе с риппером (к числу таких можно отнести программу CDex).

    Несмотря на большое разнообразие программ-кодировщиков, многие из них используют одни и те же библиотеки, т. е. в сущности, являются программами-оболочками, предоставляющие удобный интерфейс к кодировщикам, работающим из командной строки, или установленным в системе кодерам.

    Программы такого рода (их называют front-end-программами) передают введенные параметры непосредственно кодировщику и ожидают завершения процесса кодирования. Сами кодировщики называют двигателями кодирования.

    Разнообразных двигателей кодирования, в отличие от программ, не так уж и много. Прежде всего, нужно выделить кодировщики, разработанные немецким институтом Fraunhofer IIS (Institut Integrierte Schaltungen), варианты которых используются в программах MP3 Producer, MP3 Compressor, 13enc, mp3enc, AudioActive. Институт Fraunhofer IIS (рис. 7.25), в стенах которого выполнены основополагающие разработки систем сжатия звука, является признанным лидером среди научно-исследовательских лабораторий в области мультимедийных приложений (http://www.iis.fhg.de).

    Одной из первых программ-кодировщиков является 13enc, 16-битовая программа, работающая в среде DOS. Другая программа mp3enc — дальнейшее развитие 13enc для 32-битовых систем, все также работающая из командной строки, выполняет кодирование значительно быстрее, однако проявляет себя хуже в плане сохранения высоких частот.

    Рис. 7.25. Страница института Fraunhofer IIS, известного своими разработками в области сжатия аудиоданных

    Программа MP3 Producer (рис. 7.26) считается лучшим кодировщиком (по мнению авторов сайта www.mp3bench.com). При установке этой программы в систему Windows становится доступен кодер MP3, который может затем использоваться из любой программы работы со звуком. Например, можно воспользоваться стандартной программой Фонограф (Sound Recorder) и сохранять файлы в формате MP3. Список установленных в системе кодеров можно увидеть, выбрав нужный пункт в панели управления (Control panel /Multimedia/Audio compression).

    Последние версии MP3 Producer устанавливают в систему Windows только декодер файлов MP3, а код кодера интегрирован с самой программой.

    Рис. 7.26. Окно программы-кодировщика MP3 Producer

    Программа MP3 Compressor является оболочкой-интерфейсом к тому же кодеру, на котором основан и MP3 Producer. Интерфейс программы позволяет несколько иначе строить задачи кодирования и следить за их процессом. Это приложение предоставляет некоторые дополнительные возможности, не допускаемые в MP3 Producer. В частности, поддерживает работу в режиме LQ (режим, противоположный HQ — High Quality). При включенной опции LQ (Low Quality) кодировщик производит над каждым фрагментом некоторое фиксированное количество итераций, затрачивая на кодировку фрагмента определенное количество времени. Если же активизировать HQ, кодировщик будет продолжать итерационный процесс до тех пор, пока не перестанет улучшаться результат. Повышение качества в этом случае требует дополнительных временных затрат на кодировку, при этом размер выходного файла не меняется. Время кодирования при изменении режима HQ/LQ может изменяться в 2—3 раза.

    Другим несомненным достоинством программы является возможность задания большого количества файлов для кодировки и запуска программы из командной строки.

    Последние версии программы MP3 Producer (начиная с версии 2.1) также предоставляют возможность отключения режима HQ, а также имеют опцию пакетной обработки файлов (Batch Processor). Кроме того, теперь предоставляется возможность задания битрейта вплоть до 256 Кбит/с для высококачественных записей (ранние версии имели ограничение — до 128 Кбит/с).

    Другой известный производитель коммерческих кодеров MP3, компания Xing Tech (Xing Technology Corporation, адрес сайта корпорации http:// www.xingtech.com), специализируется на выпуске низкокачественных кодеров. Среди этой группы кодеров можно назвать XingMP3 Encoder, Mplifier, AudioCatalyst и др. Характерной особенностью кодировщиков от Xing Tech является высокая скорость работы (программа XingMP3 Encoder выполняет кодирование в 6—8 раз быстрее, чем MP3 Producer). Такая скорость достигается за счет безжалостного вырезания частот свыше 16 кГц, которые еще слышны человеку. В итоге, когда речь заходит о высоком качестве, кодировщики Xing Tech использованы быть не могут.

    Программа AudioCatalyst представляет собой объединение программы-риппера (на базе AudioGrabber) и кодировщика от Xing Tech.

    У кодировщиков данной группы (от Xing Tech) есть и некоторые интересные свойства. В последней версии кодировщика AudioCatalyst 1.5 реализована довольно интересная техника переменного битрейта (VBR, Variable Bit Rate). В результате кодер способен для того же суммарного объема в определенных ситуациях давать MP3-файлы даже более высокого качества, чем кодеры от Fraunhofer IIS, так как для сложно кодируемых участков становится возможным использование повышенных битрейтов, а для легко кодируемых, соответственно, — пониженных. Несомненным достоинством техники VBR-кодирования является то, что она базируется на внутренних возможностях формата MP3, не добавляя по сути ничего нового — просто эти возможности в полной мере не были использованы ранее. Соответственно, полученные MP3-файлы можно проиграть на любом MP3-плейере. Проблемы могут возникнуть иногда только при определении длительности звучания композиции, но на качество и полноценность воспроизведения это не влияет. Полностью технология переменного битрейта поддерживается программой Winamp, начиная с версии 2.09.

    Все остальные известные кодеры, авторство которых не принадлежит ни Fraunhofer IIS, ни Xing Tech, основаны на общедоступных исходных текстах кодера (ISO source), равномерно кодирующего разные частотные диапазоны, что приводит к наивысшему качеству кодирования на высоких битрейтах и вполне приличному на 128 Кбит/с. Но этот код достаточно медленный, поэтому существует единственный известный кодер, в котором он не подвергся обширным изменениям в целях оптимизации — mpegEnc. Эта программа считается эталоном качества для высших битрейтов. Из кодировщиков этой группы достойны также упоминания BladeEnc, Cdex и SoundLimit.

    Выбор кодировщика в конечном итоге определяется требованиями к качеству и времени кодирования. Для большинства любителей музыки среднего качества вполне достаточно возможностей кодировщика AudioCatalyst 1.5. Он обеспечивает наивысшую скорость кодирования и при этом дает вполне удовлетворительное качество звучания. Для обеспечения высшего качества придется прибегнуть к большим битрейтам и воспользоваться кодировщиками типа BladeEnc или mpegEnc. Из кодировщиков от Fraunhofer IIS, кроме популярных программ MP3 Producer и MP3 Compressor, рекомендуется опробовать их последнюю разработку — программу AudioActive.

    Информацию о программном обеспечении для работы со звуковыми файлами можно получить на сайтах:

    Выбор параметров кодирования

    Значительное количество встречающихся в сети Интернет файлов MP3 имеют частоту оцифровки 44,1 кГц, битрейт 128 Кбит/с и режим стерео. Считается, что такие параметры звуковых файлов обеспечивают качество, сопоставимое с аудио CD. На эти параметры и следует ориентироваться при подготовке звуковых файлов для дальнейшего прослушивания на аппаратуре среднего класса.

    На самом деле звучание файлов MP3 становится невозможно отличить от аудио CD только на битрейтах 256 Кбит/с и выше, что подтверждено профессиональными прослушивателями, нанятыми в свое время институтом Fraunhofer IIS. Однако использование битрейта 128 Кбит/с вместо 256 Кбит/с позволяет в два раза уменьшить размер файлов, что играет значительную роль при передаче по сети. При этом искажения сигнала можно ощутить только на высококлассной аппаратуре и то не на всякой фонограмме. Учитывая эти особенности принято считать, что 128 Кбит/с обеспечивает качество аудио CD.

    При кодировании можно поступиться качеством и выиграть в размере получаемых файлов (в зависимости от предназначения звуковых файлов). Для выбора параметров кодирования можно рекомендовать обратиться к табл. 7.6, по которой в зависимости от требуемого качества звука можно выбрать нужные параметры кодирования (важнейшим параметром для кодировщика является значение битрейта).

    Таблица 7.6. Приблизительные характеристики качества звука для различных режимов

    Лучше, чем LW-радио

    Лучше, чем АМ-радио

    Заметим, что процесс кодирования достаточно длителен. Так, например, кодирование 4 минут музыки на Pentium-200 ММХ программой MP3 Producer в режиме HQ с битрейтом 128 Кбит/с занимает примерно 12 минут процессорного времени в отсутствие других задач.

    Переносные плейеры звуковых файлов МР3

    Прочитав о возможностях хранения звука в формате MP3, у проницательного читателя должен появиться вопрос, не пора ли начать выпускать переносные устройства проигрывания (наподобие популярных уже на протяжении двух десятилетий аудиоплейеров). Спешим вас обрадовать, такие устройства уже существуют! Одни устройства предназначены для прослушивания файлов «на улице», другие же — для установки в автомобиле. Их можно разделить по принципу хранения данных — флэш-память, жесткие диски PC-card type I и II, а также способу расшифровки файлов — специальный процессор, предназначенный только для этих целей, или любой достаточно мощный RISC-процессор с низким энергопотреблением.

    Одним из первых переносных плейеров является MPMan, точной копией которого является плейер MPStation (http://www.mpstation.com) фирмы DigitalCast. Компания Z Company (которой, кстати, принадлежит сайт www.mp3.com) уже начала продажу в США плейеров MPMan (http://www.mpman.com), которые производятся корейской фирмой Saehan Information Systems.

    Плейер MPMan имеет размер с пачку сигарет (91x70x16,5 мм), весит всего 65 г (без батареек), не содержит движущихся частей и выпускается в двух вариантах. Модель с 32 Мб флэш-памяти может вместить до 30 минут записи, а модель с 64 Мб, соответственно, — один час. Питание осуществляется от двух аккумуляторных батарей напряжением 1,2 В, емкости которых хватает на 9 часов звучания. Плейер может устанавливаться в специальное устройство (Docking Station), оборудованное зарядным устройством и подключаться к компьютеру через стандартный параллельный порт.

    Один из крупнейших производителей аппаратуры для персональных компьютеров — компания Diamond Multimedia Systems выпустила свой портативный цифровой музыкальный плейер Rio PMP300 — первое устройство от крупной фирмы, способное воспроизводить записи, загруженные из Интернета. Плейер также имеет небольшие размеры (89x63x16 мм), весит всего 70 г. Данная модель имеет флэш-память емкостью 32 Мб с возможностью увеличения. Может подключаться к компьютеру через параллельный порт. Время заполнения флэш-карты не превышает 6 мин. Емкости батареек хватает на 12 часов непрерывного прослушивания.

    Вице-президент компании Diamond Multimedia Systems по корпоративному маркетингу Кен Вирт (Ken Wirt) считает, что этот продукт станет очень популярным. Компания планирует в ближайшее время довести объем производства до 10 тыс. штук в неделю. Это устройство размером меньше плейера Walkman обещает произвести переворот в музыкальной индустрии и приблизить эру цифрового распространения записей, предоставив больше возможностей независимым музыкальным группам.

    Видимо в ближайшее время произойдет резкий рост количества компаний, производящих подобную технику. В частности, компания Samsung объявила о завершении разработки своего плейера с названием «Yepp», выпускаемого в трех вариантах (от простого к сложному). Отличительными характеристиками этого плейера является наличие встроенного радиоприемника FM-диапазона с цифровой настройкой, а также возможность записи голоса, т. е. это устройство может использоваться в качестве диктофона. Для записи файлов формата MP3 предлагается отдельное устройство. Сведения о этих разработках можно получить на специальном сайте http://www.yepp.co.kr.

    Еще один переносной плейер — Clikman. Помимо основных функций в это устройство встроили органайзер для записи телефонов, расписания и т. д. Управление устройством осуществляется как при помощи встроенной цифровой клавиатуры, так и голосовыми командами. Для хранения всех данных используются диски Clik! от накопителей ZIP-Iomega емкостью 40 Мб. Все перечисленные возможности потребовали усложнения устройства, в результате его размеры и вес несколько превышают соответствующие параметры аналогичных устройств (вес составляет почти 200 г). Ознакомиться с новинкой более подробно можно непосредственно на сайте компании-производителя: Varo Vision Co (http://www.varovision.com/subl/clik.html).

    Однако, технологии использования формата MP3, по крайней мере, для крупной музыкальной индустрии свойственен один существенный недостаток, а именно, отсутствие средств защиты от копирования. Каждый желающий может распространять в Интернете любую преобразованную в этот формат песню: чтобы из одной копии сделать миллион, достаточно нажать на несколько клавиш. Это не нравится Американской ассоциации индустрии звукозаписи (RIAA — Recording Industry Association of America), представляющей около 90% этого бизнеса (http://www.riaa.com). Старший исполнительный вице-президент и генеральный юрисконсульт RIAA Кэри Шерман (Сагу Sherman) считает, что, бесплатно распространяя пиратские записи, новое устройство способно полностью разрушить индустрию.

    Сейчас большая часть музыкальных записей MP3 в Интернете — это пиратские копии. RIAA называет эту разработку шагом не вперед, а назад.

    Согласно заявлению ее представителей, Ассоциация видит очень мало легальных применений MP3 по сравнению с множеством вариантов пиратского использования. Компания также рассматривает возможность запрета импорта устройств типа MPMan в США.

    Встроить в плейер технологию флэш-памяти легко могли и другие компании, не менее смышленые, чем Diamond. Но они ожидали появления технологии защиты содержимого. С выпуском плейера Rio ситуация изменилась. Почему Sony должна ждать, если Diamond уже делает деньги? Эти слова Кэри Шермана оказались пророческими. Боясь отстать, Sony продемонстрировала на выставке Comdex прототипы подобных изделий. Это вызовет эффект домино, вы не успеете оглянуться, как артисты останутся абсолютно беззащитными. Опасения такого рода не беспочвенны. Интернет способен коренным образом изменить соотношение сил в музыкальной индустрии, что уже произошло в информационной технологии в целом.

    Споры о нарушении авторских прав при использовании цифровых плейеров дошли до суда. В результате эти электронные устройства признаны американским судом не относящимися к записывающим устройствам и потому не нарушающими авторские права. Суд Лос-Анджелеса в октябре 1998 г. разрешил производство и продажу устройства Rio и отказал истцу — Американской ассоциации индустрии звукозаписи в требовании к производителю прибора, фирме Diamond Multimedia, отчислять им проценты с продаж за «копирование музыкального материала». По оценке Роберта Кона, президента интернетовского сайта GoodNoise, предлагающего посетителям тысячи музыкальных записей, это решение суда «является большой победой молодых исполнителей, которые получают альтернативный способ распространения своих произведений».

    Влияние подобных устройств еще только осознается шоу-бизнесом. Они могут буквально перевернуть все аспекты работы музыкальной промышленности, включая практику распространения и лицензирования копий. Например, группы начнут конкурировать в реальном времени, выпуская не диск за диском, а песенку за песенкой, публикуя особо удачные концертные исполнения, и т. д.

    Легко представить себе, например, как трансформируется существующая в российских городах инфраструктура распространения популярной музыки среди подростков. Киоски с кассетами превратятся в пункты записи звуковых файлов со своими каналами доступа к Интернету и прокси-серверами. Успех у публики (а не у диск-жокеев радиостанций) станет доступен непосредственному измерению. Опубликовать свою запись через сеть Интернет сможет буквально любой, что правда может привести к засилию низкопробной продукции.

    Технология сжатия звуковых файлов MP3 постепенно проникает во все сферы использования звука. С развитием каналов передачи данных и возможностей сжатия эта технология вышла на уровень потоковой передачи данных в реальном времени, где до сих пор безраздельно господствовала технология RealAudio. Компания Nullsoft (http://www.nullsoft.com/), создатель знаменитого плейера Winamp теперь, кроме продвижения самого плейера, активно занимается развитием и пропагандой технологии ShoutCast, предназначенной для потоковой передачи аудиоданных в формате MP3. Единственное, что нужно обычному пользователю для того, чтобы послушать сетевую MP3-станцию, или открыть собственную, это сам плейер Winamp. По адресу http://www.shoutcast.com/ можно найти адреса более чем 300 серверов, вещающих в формате MP3, и список десяти лучших из них.

    Звуковые файлы формата VQF

    Популярность и широкое распространение технологий MP3 вызвали бурный рост числа разработок в области сжатия звука. Стали появляться новые стандарты и форматы хранения звука, которые в будущем, возможно, придут на смену существующим. В последующих разделах кратко остановимся на современных достижениях в этой области.

    Наряду с широко известным на сегодняшний день форматом MP3 сравнительно недавно появился формат VQF, имеющий более высокую степень сжатия и качество воспроизведения.

    Формат VQF основывается на технологии TwinVQ (Transform-domain Weighted Interleave Vector Quantization — векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Laboratories (http://www.hil.ntt.co.jp/top /index_e.html). Патент на использование этого формата принадлежит фирме NTT, однако основное программное обеспечение для работы с этим форматом предлагает фирма Yamaha. Компания Yamaha предлагает, пожалуй, лучшее программное обеспечение для создания и воспроизведения файлов формата VQF под маркой SoundVQ (http://www.yamaha.co.jp/english/xg/SoundVQ/). При установке плейера одновременно инсталлируются подключаемые модули для воспроизведения файлов VQF в браузеры Netscape и Internet Explorer.

    Существует также и программное обеспечение от компании разработчика технологии TwinVQ (http://music.jpn.net/software-e.html).

    Этот формат по использованию идей сжатия весьма похож на MP3. Приведем их сравнительные характеристики.

    VQF-файлы примерно на 30—35% меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также примерно на 30% выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы. Для качественного воспроизведения минимальным требованием является процессор Pentium-90, рекомендуется Pentium-200 MMX. Для кодирования минимальным требованием является компьютер с процессором Pentium-66. Высокая степень сжатия требует значительных временных затрат на кодирование файлов в формате VQF. Так кодирование 4 минут музыки на Pentium-200 MMX занимает примерно 20 минут процессорного времени. Это значительно больше, чем при кодировании файлов MP3.

    Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2—3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плейера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3, но субъективное восприятие различных композиций формата VQF дало старт затяжной полемике между приверженцами хорошо проверенного старого (MP3) и новинок (формата VQF и формата ААС, о котором пойдет речь далее). Узкопрофессиональные споры не мешают сделать широкой интернетовской общественности выбор в пользу нового формата. Наиболее распространенное мнение сейчас можно сформулировать примерно так: «Если и есть какие-то различия, то нужно быть профессиональным музыкантом, чтобы их заметить».

    На текущий момент в сети Интернет можно найти довольно много музыкальных произведений в формате VQF, однако их количество и степень популярности значительно уступают MP3. Также значительно меньше существует программ-плейеров и кодеров.

    Для проигрывания файлов можно рекомендовать программу K-Jofol. Появились также подключаемые модули для Winamp, проигрывающие файлы VQF (этот модуль использует декодер компании Yamaha).

    Программа K-Jofol версии 0.51 занимает 1,4 Мб (как раз одна дискетка). Позволяет воспроизводить файлы форматов VQF, ААС, MP3 и др. Дает возможность декодировать файлы в формат WAV. На сегодняшний день считается самым быстрым плейером, использующим свои собственные декодеры для всех форматов.

    Программе характерен оригинальный дизайн. Уже при инсталляции можно заметить (рис. 7.27), что авторы попытались уйти от традиционных прямоугольных окон, придав им вычурные формы (рис. 7.28, 7.29). На первых порах немного непривычно, однако довольно быстро удается приспособиться. Возможности и методы работы с программой во многом аналогичны другим плейерам.

    Рис. 7.27. Окно инсталлятора программы K-Jofol

    Рис. 7.28. Основное окно программы K-Jofol

    Рис. 7.29. Список проигрываемых файлов программы K-Jofol

    Информацию о формате VQF можно получить с официального сайта http://www.vqf.com. О программе K-Jofol можно узнать на сайте http://www.kjofol.org. Найти иную информацию в Интернете, а также файлы в этом формате, можно с помощью любой поисковой системы, указав для поиска слово «vqf. О быстром росте популярности этого формата свидетельствует следующий факт. Если в сентябре 1998 г. запрос по слову «vqf поисковой системе AltaVista давал всего 20 ссылок, то в начале 1999 г. по такому запросу выдавалось уже несколько тысяч ссылок.

    Популярность формата VQF пока значительно уступает MP3. Рынок программного обеспечения работы с такими звуковыми файлами еще не вполне устоялся. Частенько появляются сообщения о весьма неустойчивой работе многих программ-проигрывателей этого формата. Это относится и к подключаемым модулям программы Winamp (попадаются просто неработоспособные версии), так и программе K-Jofol. Если у вас воспроизведение файлов такого формата идет с явными искажениями (даже на достаточно мощной машине), попробуйте прежде всего обновить версию программы-проигрывателя или используйте другую программу. Только во вторую очередь следует грешить на сам звуковой файл.

    Звуковые файлы формата ААС

    Формат ААС (Advanced Audio Coding) представляет еще один из числа появившихся сравнительно форматов кодирования звуковой информации, в котором осуществляется сжатие с потерями. На сегодняшний момент ААС представляет собой лучшую систему сжатия высококачественного звука. Это последний из стандартов MPEG-2. Перевести ААС можно как «Продвинутое Аудио Кодирование», название, которое появилось из-за исключительно высокого качества звучания и очень сильной системы сжатия.

    На данный момент различают четыре разновидности формата ААС:

    • HomeboyAAC
    • AT&T a2bAAC
    • Liquifier Pro AAC
    • Astrid/Quartex AAC

    По всем объективным параметрам последние две модификации ААС превосходят как MP3, так и VQF.

    Все четыре разновидности несовместимы между собой и используют свои собственные программы кодирования и воспроизведения.

    Далее мы кратко их охарактеризуем.

    Это первая версия ААС, кодер для которой стал общедоступен. Ее можн о охарактеризовать одним словом — отвратительно. Крайне корявые и медленные кодеры в сочетании с отчетливо слышимыми искажениями сыграл и свою роль в отталкивании широких масс от этого формата. Единственным и его плюсами является достижение качества MP3 128 Кбит/с на более низк их битрейтах и наличие приятного и быстрого плейера BitAAC. Сейчас это т формат уже практически не используется и даже ссылки на программное обеспечение для него почти исчезли со страниц Интернета. Следует иметь в виду, что большинство программ, распространяемых через Интернет по д видом кодеров ААС, являются кодерами именно этого формата. Во времена появления и развития этой ветви ААС уже существовал формат VQF.

    Известная компания AT&T не могла остаться в стороне от технологий новых систем сжатия аудиоданных. При фирме было создано специальное подразделение, занимающееся созданием программ и раскруткой нового формата, который получил название a2b. Строго говоря, этот формат практически полностью следует тем же самым принципам компрессии, что и предыдущий. Однако фирмой были предприняты значительные усилия по повышению качества звучания (в результате чего снизилась степень сжатия) и внесению новых элементов в формат. Составной частью формата a2b стала возможность включения изображения исполнителя и текста песни внутрь аудиофайла. Также была разработана технология получения самовоспроизводящихся песен (исходную композицию можно преобразовать в .ехе-файл, включающий в себя все необходимые для воспроизведения, что увеличивало файл всего примерно на 170 Кб). Для файлов этого формата существует удобный и бесплатный плейер с поддержкой многих дополнительных возможностей. Однако, несмотря на мощнейшую рекламную компанию и на очевидные достоинства формата, он не нашел широкого применения по одной простой причине — отсутствию общедоступного кодера! Мало того, эта уважаемая фирма пыталась запатентовать и запретить к использованию все составные части формата. К счастью, это у нее не вышло, — патент был получен только на собственные нововведения. Сейчас уже рекламный пыл немного угас и со своего сайта компания предлагает приобрести уже готовые файлы или бесплатно скачать несколько композиций.

    Формат по степени сжатия превосходит MP3, но на 15—20% уступает VQF, РАС, Astrid/Quartex ААС и Liquifier Pro AAC.

    Качество звучания a2b 96 Кбит/с сравнимо с качеством MP3 128 Кбит/с и VQF 96 Кбит/с, но уступает Liquifier Pro AAC 96, Astrid/Quartex AAC 96 и РАС 96.

    Дополнительную информацию можно получить в Интернете по адресу http://www.a2bmusic.com/.

    Liquifier Pro AAC

    Естественно компания AT&T не могла остаться одинокой на рынке борьбы за первенство в области высококачественной компрессии звука. Через некоторое время фирма Liquid Audio нанесла если не сокрушительный, то очень опасный удар по честолюбивым замыслам остальных. Предложенная ей версия формата ААС наиболее четко следовала всем техническим тонкостям и в результате появилась лучшая на сегодняшний день система сжатия звука. Она по степени сжатия и качеству звучания превосходит все существующие в данный момент форматы. И хотя превосходство по сжатию над VQF и Astrid/Quartex AAC незначительное — минимальный битрейт, заслуживающий внимания, все те же 96 Кбит/с, звук превосходит все ожидания!

    К сожалению, политика компании Liquid Audio на данный момент слабо отличается от политики AT&T — есть отличный плейер, но нет общедоступного кодера (существовала демо-версия, но она работала только в он-лайне и через несколько дней неожиданно самоуничтожалась, а все закодированные ей файлы становились неработоспособными).

    Подводя итоги, заметим, что этот формат по всем параметрам превосходит все остальные и объективно является лучшим. Среди самых последних новостей отметим появление звуковых файлов в этом формате (они имеют расширение LQT), причем для их воспроизведения можно воспользоваться плейером компании Liquid Audio или же установить plugin для программы Winamp (in_lqt.dll), который на самом деле пользуется все тем же, несколько «исправленным» плейером, перенаправляя звук в программу Winamp.

    Дополнительную информацию можно получить в Интернете по адресу http://www.liquidaudio.com/.

    В октябре 1998 г. в «спор гигантов» вступило частное лицо. Никому не известный и скромный программист создал, на основе изданных фирмой NTT в мае исходников МР4, свою собственную систему компрессии! Им было предложено протестировать кодер, для чего он был выложен в Интернете по адресу http://www.geocities.com/ResearchTriangle/Facility/2141/.

    Уже через несколько дней после выхода новой версии популярного плейера K-Jofol, для которого автор формата Astrid/Quartex AAC написал декодирующий модуль, появились восторженные отклики. Кодер, обладающий непритязательным интерфейсом командной строки, по сжатию и качеству звучания превосходил кодировщики от AT&T ААС и YAMAHA VQF. При этом качество звука практически не уступало хваленому Liquifier Pro AAC. Почти одновременно появились графические интерфейсы (front-end) для нового кодировщика и масса хвалебных отзывов в разных источниках. При всех видимых недостатках сегодняшней версии 0.2 (поддержка только WAV 44 кГц/16 бит РСМ и степени сжатия только 64, 96 и 128 Кбит/с), она уже широко применяется (есть целые ftp-сайты с музыкой в этом формате) и все с нетерпением ждут новых версий.

    По степени сжатия и качеству звучания формат превосходит все остальные, кроме Liquifier Pro AAC, и является объективно лучшим среди тех, что имеют общедоступные кодеры и доступные для распространения в Интернете звуковые файлы. По сравнению с MP3 обеспечивается аналогичное качество при потоке на 30% меньше. Качество Astrid AAC 96 Кбит/с много лучше качества VQF/96 Кбит/с. Возможно также потоковое воспроизведение.

    Звуковые файлы формата РАС

    Несколько особняком от остальных систем кодирования стоит формат РАС (Perceptive Audio Coding). Впервые эта аббревиатура появилась в стенах лаборатории Bell Labs/Lucent Technologies (кстати, там же впервые появилось сокращение ААС) в самом конце 1997 года. Через некоторое время стали появляться очень интересные сообщения от других фирм-разработчиков, которые не могли не заинтриговать интересующегося человека.

    Так было заявлено о следующих возможностях:

      достижении качества MP3 128 Кбит/с в формате РАС с битрейтом 64 Кбит/с;

    поддержка потокового воспроизведения через Интернет;

    прямое преобразование из Audio-CD в РАС без промежуточных огромных WAV-файлов на диске;

    кодирование в реальном времени на Pentium-166 (даже не ММХ);

    защита от свободного распространения РАС-файлов по Интернету и на CD-R;

  • широкие возможности упорядочения готовых РАС-файлов (плей-листы, каталоги, описания и т. д.).
  • В середине лета 1998 г. известная фирма Celestial Technologies выпустила первую и до сих пор единственную программу для кодирования и воспроизведения звука в формате РАС — «Audio Library 1.0». Хотя программа бесплатно работает только 15 дней и позволяет в одном каталоге хранить не более 5-ти композиций, уже можно сделать кое-какие выводы. Первое, что бросается в глаза, это отсутствие, как таковых, файлов в формате РАС. Во время своей работы программа создает базу данных, состоящую из 8 файлов с расширением TPS, в отдельном каталоге, причем для воспроизведения необходимы минимум 7 из них (GREGLANG.TPS можно выкинуть) Увеличение количества композиций не меняет количества файлов — при добавлении новой песни в базу просто увеличивается размер файла SONGDATA.TPS.

    И во всем остальном программа удивляет. Хотя пока на битрейте 64 Кбит/с звук уступает MP3 128 Кбит/с, качество звучания РАС 128 Кбит/с поражает воображение. При этом кодер обеспечивает обещанную скорость кодирования.

    Большего сказать о данном формате пока не представляется возможным. Нужно подождать новых версий кодеров.

    Новую информацию можно получить по адресу http://www.celestialtech.com/.

    Новый формат хранения звука МР4

    Работа над новыми стандартами в области хранения звука не стоит на месте. И вот, наконец, в ноябре 1998 г. все заинтересованные стороны пришли к согласию об окончательной спецификации нового формата сжатия звука МР4. Как и ожидалось, в основе нового формата лежат VQF и ААС.

    Появление нового стандарта, однако, не предполагает быстрого появления программ, работающих в этом формате. По самым оптимистичным прогнозам первые кодеры и плейеры появятся к началу-середине лета 1999г., а более или менее продвинутые, с оптимизацией скоростей кодирования и воспроизведения, программы следует ожидать не ранее 2000-го года. Следовательно, в ближайшее время всем придется пользоваться уже существующими форматами.

    Первые разработки по новому формату были представлены в январе 1999 г. компанией Global Music Outlet. Пока рано делать какие-либо выводы о возможностях и перспективах этого формата. Вполне может случиться, что формат с таким названием останется лишь в виде спецификации, а в реальной жизни будут появляться и использоваться другие форматы, предложенные отдельными компаниями.

    Вызывает некоторое удивление само название формата — МР4 из-за возможной путаницы с MPEG-4, форматом аудио- и видеокомпрессии, принятым Международной организацией по стандартизации в качестве открытого стандарта распространения мультимедийной информации. Между обеими технологиями нет ничего общего.

    Новости о развитии ситуации можно узнать на сайте http://mp4.globalmusic.com/. Компания Global Music Outlet обещала, что одной из первых записей в новом формате будут произведения группы Public Enemy, которые будут опубликованы на ее Web-сайте (http://www.public-enemy.com/).

    Компания также рассчитывает соблазнить «китов» музыкальной индустрии возможностью формата МР4 записывать звуковые файлы с защитой от нелицензионного копирования.

    Компания Microsoft, естественно, не могла обойти вниманием быстро развивающиеся технологии сжатия звуковых данных. Была разработана собственная технология кодирования звука, быстро получившая распространение. Формат соответствующих файлов получил название WMA (изначально он был назван ASF). Быстрому внедрению формата должна способствовать маркетинговая политика компании Microsoft, которая включила поддержку нового формата в свой проигрыватель (Media Player), который можно свободно получить с сайта компании. Также в свободном доступе кодировщик файлов формата WMA.

    Поддержка воспроизведения файлов WMA включена в программу Winamp с версии 2.20. Эту же программу можно использовать и в качестве кодировщика.

    Понравилась статья? Поделиться с друзьями:
    Кодинг, CSS и SQL
    Качество звука Частотный диапазон, кГц Режим Битрейт, Кбит/с Степень сжатия