Скачать

Мультимедиа

м

ультимедиа — это интерактивные системы, обеспечивающие ра­боту с непод­вижными изображениями и движущимся видео, анимированной компьютерной графикой и текстом, речью и высококачественным звуком.

Появление систем мультимедиа, безусловно, производит революционные изменения в таких областях, как образование, компьютерный тренинг, во многих сферах профессиональной деятельности, науки, искусства, в компьютерных играх и т.д.

Появление систем мультимедиа подготовлено как с требованиями прак­тики, так и с развитием тео­рии. Однако, резкий рывок в этом направлении, произошедший в этом направлении за последние несколько лет, обеспечен прежде всего развитием технических и системных средств. Это и прогресс в развитии ПЭВМ: резко возросшие объем памяти, быстродействие, графиче­ские возможности, характеристики внешней памяти, и достижения в об­ласти видеотехники, лазерных дисков — аналоговых и CD-ROM, а также их массовое внедрение. Важную роль сыграла так же разработка методов быстрого и эффективного сжатия / развертки данных.

Современный мультимедиа–ПК в полном “вооружении” напоминает домашний стереофонический Hi–Fi комплекс, объединенный с дисплеем–те­левизором. Он укомплектован активными стереофоническими колонками, микрофоном и дисководом для оптических компакт–дисков CD–ROM (CD — Compact Disc, компакт–диск; ROM — Read only Memory, память только для считывания). Кроме того, внутри компьютера укрыто новое для ПК устройство — аудиоадаптер, по­зволивший перейти к прослушиванию чистых стереофонических звуков че­рез акустические колонки с встроенными усилителями.

Рассмотрим некоторые технические вопросы, касающиеся мультимедиа. Основная проблема, из которой “растут” все основные — совместная обработка разнородных данных: цифровых и аналоговых, “живого” видео и неподвижных изображений и т.п. В компьютере все дан­ные хранятся в цифровой форме, в то время как теле-, видео- и большин­ство аудиоаппаратуры имеет дело с аналоговым сигналом. Однако выходные устройства компьютера — мониторы и динамики имеют анало­говый выход. Поэтому простейший и наиболее дешевый путь построения первых систем мультимедиа состоял в стыковке разнородной аппаратуры с компьютером, предоставлении компьютеру возможностей управления этими устройствами, совмещении выходных сигналов компьютера и видео- и аудиоустройств и обеспечении их нормальной совместной работы. Даль­нейшее развитие мультимедиа происходит в направлении объедине­ния разнородных типов данных в цифровой форме на одной среде-носителе, в рамках одной системы.

ВИДЕО

При смешении сигналов основные проблемы возникают с видео–изоб­ражением. Различные ТВ–стандарты, существующие в мире (NTSC, PAL, SE­CAM), применение разных мониторов и видеоконтроллеров диктует разнообразие подходов в разрешении возникающих проблем. Однако в лю­бом случае требуется синхронизация двух изображений, для чего служит устройство генлок (genlock). С его помощью на экране монитора могут быть совмещены изображение, сгенерированное компьютером (анимированная или неподвижная графика, текст, титры), и “живое” видео. Если добавить еще одно устройство — кодер (encoder), компьютерное изо­бражение может быть преобразовано в форму ТВ–сигнала и записано на ви­деопленку. "Настольные видео–студии”, являющиеся одним из примеров применения систем мультимедиа, позволяют готовить совмещенные видео–компьютерные клипы, титры для видеофильмов, помогают при монтаже кинофильмов.

Системы такого рода не позволяют как-то обрабатывать или редак­тировать само аналоговое изображение. Для того, чтобы это стало воз­можным, его необходимо оцифровать и ввести в память компьютера. Для этого служат так называемые платы захвата (capture board, frame grab­bers). Оцифровка аналоговых сигналов порождает огромные массивы дан­ных. Так, кадр стандарта NTSC (525 строк), преобразованный платой типа Truevision, превращается в компьютерное изображение с разрешением 512x482 пиксель. Если каждая точка представлена 8 битами, то для хранения всей картинки требуется около 250 Кбайт памяти, причем падает качество изображения, так как обеспечивается только 256 различных цветов. Считается, что для адекватной передачи исходного изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения цветной картинки, а необходимый размер памяти возрастает. Оцифрованный кадр может затем быть изменен, отредактирован обычным графическим редактором, могут быть убраны или добавлены детали, изменены цвета, масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д. Естественно, интерактивная экранная обработка возможна лишь в пределах разрешения, обеспечиваемого данным конкретным видеоадаптером. Обработанные кадры могут быть записаны на диск в каком–либо графическом формате и затем использоваться в качестве реалистического неподвижного фона для компьютерной анимации. Возможна также покадровая обработка исходного изображения и вывод обратно на видеопленку для создания псевдореалистического мультфильма.

Запись последовательности кадров в цифровом виде требует от компьютера больших объемов внешней памяти: частота кадров в американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM — 25 кадров/с), так что для запоминания одной секунды полноцветного полноэкранного видео требуется 20–30 Мбайт, а оптический диск емкостью 600 Мбайт вместит менее полминуты изображения. Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на экран в соответствующем темпе. Подобной скоростью передачи информации — около 30 Мбайт / с — не обладает ни одно из существующих внешних запоминающих устройств. Чтобы выводить на экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых данных, (вывод уменьшенного изображения в небольшом окне, снижение частоты кадровой развертки до 10–15 кадров / с, уменьшение числа бит / пиксель), что, в свою очередь приводит к ухудшению качества изображения.

Более радикально обе проблемы — памяти и пропускной способности — решаются с помощью методов сжатия / развертки данных, которые позволяют сжимать информацию перед записью на внешнее устройство, а затем считывать и разворачивать в реальном режиме времени при выводе на экран. Так, для движущихся видео–изображений существующие адаптивные разностные алгоритмы могут сжимать данные с коэффициентом порядка 100:1— 160:1, что позволяет разместить на CD–ROM около часа полноценного озвученного видео. Работа этих алгоритмов основана на том, что обычно последующий кадр отличается от предыдущего лишь некоторыми деталями, поэтому, взяв какой–то кадр за базовый, для следующих можно хранить только относительные изменения. При значительных изменениях кадра, например, при монтажной склейке, наезде или панорамировании камеры, автоматически выбирается новый базовый кадр. Для статических изображений коэффициент сжатия, естественно, ниже — порядка 20–30:1. Для аудиоданных применяют свои методы компрессии.

Существует симметричная и асимметричная схемы сжатия данных. При асимметричной схеме информация сжимается в автономном режиме (т.е. одна секунда исходного видео сжимается в течение нескольких секунд или даже минут мощными параллельными компьютерами и помещается на внешний носитель, например CD–ROM. На машинах пользователей устанавливаются сравнительно дешевые платы декодирования, обеспечивающие воспроизведение информации мультимедиа в реальном времени. Использование такой схемы увеличивает коэффициент сжатия, улучшает качество изображения, однако пользователь лишен возможности разрабатывать собственные продукты мультимедиа. При симметричной схеме сжатие и развертка происходят в реальном времени на машине пользователя, благодаря чему за персональными компьютерами и в этом случае сохраняется их основополагающее достоинство: с их помощью любой пользователь имеет возможность производить собственную продукцию, в том числе и коммерческую, не выходя из дома. Правда, при симметричной схеме несколько падает качество изображения: появляются “смазанные” цвета, картинка как бы расфокусируется. С развитием технологии эта проблема постепенно уходит, однако пока иногда предпочитают смешанную схему, при которой разработчик продукта готовит, отлаживает и испытывает продукт мультимедиа на своей машине с симметричной схемой, а затем “полуфабрикат” в стандартном формате отсылается на фирму, где его подвергают сжатию на мощном компьютере, с использованием более совершенных алгоритмов и помещают результирующий продукт на CD–ROM.

В настоящее время целый ряд фирм активно ведет разработку алгоритмов сжатия видеоинформации, стремясь достичь коэффициента сжатия порядка 200:1 и выше. В основе наиболее эффективных алгоритмов лежат различные адаптивные варианты: DCT (Discrete Cosine Transform, дискретное косинус–преобразование), DPCM (Differential Pulse Code Modulation, разностная импульсно–кодовая модуляция), а также фрактальные методы. Алгоритмы реализуются аппаратно — в виде специальных микросхем, или “firmware” — записанной в ПЗУ программы, либо чисто программно.

Разностные алгоритмы сжатия применимы не только к видео–изображениям, но и к компьютерной графике, что дает возможность применять на обычных персональных компьютерах новый для них вид анимации, а именно покадровую запись рисованных мультфильмов большой продолжительности. Эти мультфильмы могут хранится на диске, а при воспроизведении считываться, распаковываться и выдаваться на экран в реальном времени, обеспечивая те же необходимые для плавного изображения 25–30 кадров в секунду.

При использовании специальных видео–адаптеров (видеобластеров) мультимедиа–ПК становятся центром бытовой видео–системы, конкурирующей с самым совершенным телевизором.

Новейшие видеоадаптеры имеют средства связи с источниками телевизионных сигналов и встроенные системы захвата кадра (компрессии / декомпрессии видеосигналов) в реальном масштабе времени, т.е. практически мгновенно. Видеоадаптеры имеют быструю видеопамять от 2 до 4 Мбайт и специальные графические ускорители процессоры. Это позволяет получать до 30–50 кадров в секунду и обеспечить вывод подвижных полноэкранных изображений.

АУДИО

Любой мультимедиа–ПК имеет в своем составе плату–аудиоадаптер. Для чего она нужна? С легкой руки фирмы Creative Labs (Сингапур), назвавшей свои первые аудиоадаптеры звонким словом Sound Blaster, эти устройства часто именуются “саундбластерами”. Аудиоадаптер дал компьютеру не только стереофоническое звучание, но и возможность записи на внешние носители звуковых сигналов. Как уже было сказано ранее, дисковые накопители ПК совсем не подходят для записи обычных (аналоговых) звуковых сигналов, так как рассчитаны для записи только цифровых сигналов, которые практически не искажаются при их передаче по линиям связи.

Аудиоадаптер имеет аналого–цифровой преобразователь (АЦП), периодически определяющий уровень звукового сигнала и превращающий этот отсчет в цифровой код. Он и записывается на внешний носитель уже как цифровой сигнал.

Цифровые выборки реального звукового сигнала хранятся в памяти компьютера (например, в виде WAV–файлов). Считанный с диска цифровой сигнал подается на цифро–аналоговый преобразователь (ЦАП), который преобразует цифровые сигналы в аналоговые. После фильтрации их можно усилить и подать на акустические колонки для воспроизведения. Важными параметрами аудиоадаптера являются частота квантования звуковых сигналов и разрядность квантования.

Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 КГц до 45–48 КГц.

Разрядность квантования характеризует число ступеней квантования и изменяется степенью числа 2. Так, 8–разрядные аудиоадаптеры имеют 28=256 степеней, что явно недостаточно для высококачественного кодирования звуковых сигналов. Поэтому сейчас применяются в основном 16-разрядные аудиоадаптеры, имеющие 216 =65536 ступеней квантования — как у звукового компакт–диска.

Таблица 1.

Частотный диапазон

Вид сигнала

Частота квантования

400 – 3500 Гц

Речь (едва разборчива)

5.5 КГц

250 – 5500 Гц

Речь (среднее качество)

11.025 КГц

40 – 10000 Гц

Качество звучания УКВ–приемника

22.040 КГц

20 – 20000 Гц

Звук высокого качества

44.100 КГц

Другой способ воспроизведения звука заключается в его синтезе. При поступлении на синтезатор некоторой управляющей информации по ней формируется соответствующий выходной сигнал. Современные аудиоадаптеры синтезируют музыкальные звуки двумя способами: методом частотной модуляции FM (Frequency Modulation) и с помощью волнового синтеза (выбирая звуки из таблицы звуков, Wave Table). Второй способ обеспечивает более натуральное звучание.

Частотный синтез (FM) появился в 1974 году (PC–Speaker). В 1985 году появился AdLib, который, используя частотную модуляцию, был способен играть музыку. Новая звуковая карта SoundBlaster уже могла записывать и воспроизводить звук. Стандартный FM–синтез имеет средние звуковые характеристики, поэтому на картах устанавливаются сложные системы фильтров против возможных звуковых помех.

Суть технологии WT–синтеза состоит в следующем. На самой звуковой карте устанавливается модуль ПЗУ с “зашитыми” в него образцами звучания настоящих музыкальных инструментов — сэмплами, а WT–процессор с помощью специальных алгоритмов даже по одному тону инструмента воспроизводит все его остальные звуки. Кроме того многие производители оснащают свои звуковые карты модуляторами ОЗУ, так что есть возможность не только записывать произвольные сэмплы, но и подгружать новые инструменты.

Кстати, управляющие команды для синтеза звука могут поступать на звуковую карту не только от компьютера, но и от другого, например, MIDI (Musical Instruments Digital Interface) устройства. Собственно MIDI определяет протокол передачи команд по стандартному интерфейсу. MIDI–сообщение содержит ссылки на ноты, а не запись музыки как таковой. В частности, когда звуковая карта получает подобное сообщение, оно расшифровывается (какие ноты каких инструментов должны звучать) и отрабатывается на синтезаторе. В свою очередь компьютер может через MIDI управлять различными “интеллектуальными” музыкальными инструментами с соответствующим интерфейсом.

Для электронных синтезаторов обычно указывается число одновременно звучащих инструментов и их общее число (от 20 до 32). Также важна и программная совместимость аудиоадаптера с типовыми звуковыми платформами (SoundBlaster, Roland, AdLib, Microsoft Sound System, Gravis Ultrasound и др.).

В качестве примера рассмотрим состав узлов одного из мощных аудиоадаптеров — SoundBlaster AWE 32 Value. Он содержит два микрофонных малошумящих усилителя с автоматической регулировкой усиления для сигналов, поступающих от микрофона, два линейных усилителя для сигналов, поступающих с линии, с проигрывателя звуковых дисков или музыкального синтезатора. Кроме того, сюда входят программно–управляемый электронный микшер, обеспечивающий смешение сигналов от различных источников и регулировку их уровня и стереобаланса, 20-голосый синтезатор музыкальных звуков частотной модуляции FM, программно управляемый волновой (табличный) синтезатор музыкальных звуков и звуковых эффектов (16 каналов, 32 голоса, 128 инструментов), аналого–цифровой 16-разрядный преобразователь для превращения аналогового сигнала с выхода микшера в цифровой сигнал, систему сжатия цифровой информации с возможностью применения расширенного звукового процессора ASP. Наконец, аудиоадаптер имеет цифро–аналоговый преобразователь (ЦАП) для превращения цифровых сигналов, несущих информацию о звуке, в аналоговый сигнал, адаптивный электронный фильтр на выходе ЦАП, снижающий помехи от квантования сигнала, двухканальный усилитель мощности по 4 Вт на канал с ручным и программно–управляемым регулятором громкости и MIDI–разъем для подключения музыкальных инструментов.

Как видно из этого перечня, аудиоадаптер — достаточно сложное техническое устройство, построенное на основе использования последних достижений в аналоговой и цифровой аудиотехнике.

В новейшие звуковые карты входит цифровой сигнальный процессор DSP (Digital Signal Processor) или расширенный сигнальный процессор ASP (Advanced Signal Processor). Они используют совершенные алгоритмы для цифровой компрессии и декомпрессии звуковых сигналов, для расширения базы стереозвука, создания эха и обеспечения объемного (квадрофонического) звучания. Программа поддержки ASP QSound поставляется бесплатно фирмой Intel на CD-ROM “Software Developer CD”. Важно отметить, что процессор ASP используется при обычных двухканальных стереофонических записи и воспроизведении звука. Его применение не загружает акустические тракты мультимедиа компьютеров.

НОСИТЕЛИ ИНФОРМАЦИИ

Важной проблемой мультимедиа является обеспечение адекватных средств доставки, распространения мультимедиа–информации. Носители должны вмещать огромные объемы разнородной информации, позволять быстрый доступ к отдельным ее компонентам, качественное их воспроизведение, и при этом быть достаточно дешевым, компактным и надежным. Эта проблема получила достойное решение лишь с появлением оптических дисков различных типов. В первых системах мультимедиа были использованы аналоговые диски — их обычно называют “видеодисками”. Диаметр этих дисков 12 или 8 дюймов. Известны 12–дюймовые диски стандарта LV (Laser Vision), поддерживаемого Sony, Philips и Pioneer.

Информация записывается на лазерный диск по спирали, каждый виток этой спирали называется дорожкой. Существуют 2 способа записи информации на лазерные диски — CAV (Constant Angular Velocity, с постоянной угловой скоростью) и CLV (Constant Linear Velocity, с постоянной линейной скоростью). При записи CLV диски вмещают по 1 часу видео на каждой из сторон (диски CLV называют также “долгоиграющими”), однако их интерактивные возможности ограничены, поэтому они в системах мультимедиа используются редко, чаще применяются при записи фильмов.

Диск CAV вмещает на каждой дорожке один видеокадр (точнее, два полукадра, содержащие четные и нечетные строки кадра — телевизор работает в интерлейсном режиме, попеременно высвечивая четные и нечетные строки каждого кадра). Диск вращается с постоянной скоростью 30 об / с, обеспечивая необходимые для NTSC 30 кадров / с. Каждая из сторон диска имеет 54000 дорожек, т.е. вмещает 30 минут видео NTSC (диски для PAL — 37 минут). Каждый кадр имеет свой номер, или адрес, по номеру возможен прямой доступ к любому кадру. Кадры могут трактоваться как неподвижные изображения — для этого после завершения считывания дорожки устройство не переходит на следующую, а вновь считывает ту же самую); возможно также проигрывание с разными скоростями и в обратном направлении. Вместе с изображением записываются две звуковые дорожки, доступные, впрочем, только при просмотре кадров в режиме видео. Информацию на диске можно разбить на “части” — до 80 частей на каждой из сторон. Управляющая информация — номера кадров, номера частей — помещается в “бланковых” (невидимых) частях кадров.

Промежуточный, “аналого–цифровой” формат лазерных дисков — LVROM, или AIV (Advanced Interactive Video, улучшенное интерактивное видео) — позволяет сочетать на одном диске аналоговое видео с цифровым звуком и данными.

Наконец, существуют разные типы чисто цифровых дисков: CD–ROM, WORM, стираемые. CD–ROM, как и цифровые аудио–компакт–диски CD–DA (Compact Disc — Digital Audio) имеют диаметр 5.25 дюйма; они вмещают 500–600 Мбайт информации и являются сейчас наиболее массовым цифровым средством доставки мультимедиа–информации.

Таблица 2.

Формат

Описание

CD–Audio

Старейший формат компакт–дисков. Почти все дисководы CD–ROM могут проигрывать звуковые компакт–диски.

CD–Interactive

Собственный формат Philips для “интерактивных”, в основном, игровых компакт–дисков для домашних проигрывателей.

CD–ROM / XA

Сочетает сжатые данные и звук, а так же смешанный режим, записываются с чередованием для более ровного воспроизведения. Лучший формат для мультимедиа.

Mixed mode

Комбинация звука в формате Red Book и данных CD–ROM. Первая дорожка должна содержать данные, за ней могут следовать дорожки CD–Audio.

CD–Plus

Сходен с режимом Mixed mode, отличие — предотвращение обращения звукового проигрывателя к дорожкам с данными во избежание повреждения динамиков.

ISO–9660

Стандартный формат и структура каталогов для CD–ROM.

HFS (Hierarhical File Structure)

Формат данных, разработанный для Macintosh.

Hybrid discs

Содержит системы HFS и ISO.

Photo CD

Разработан фирмой Kodak для записи фотографий высокого качества. Для воспроизведения необходимо устройство CD–ROM / XA или CD–Interactive.

Video CD

Видеоинформация в формате MPEG–1 и звук. Стандарт предназначен для воспроизведения фильмов.

CD–ROM диск — кружок из прозрачной пластмассы, поликарбоната, на одной из поверхностей которого нанесен тонкий светоотражающий слой. Этот серебристый слой хорошо виден с тыльной стороны прозрачного диска. В нем имеются микроскопические углубления — питы, созданные в процессе его копирования с оригинала.

Типичная длина пита 0.8 – 3.2 мкм, ширина 0.4 мкм, глубина 0.12 мкм, а расстояние между отдельными дорожками 1.6 мкм. На одном дюйме (2.54 см) поверхности диска размещается 16 тыс. дорожек (для сравнения — на одном дюйме магнитного диска помещается только 96 дорожек). Благодаря столь малым размерам питов обычный CD–ROM вмещает огромный объем информации — порядка 700 Мбайт. Новые типы дисков имеют на порядок больший объем и допускают запись информации пользователем.

Рабочей является только одна поверхность диска CD–ROM. Она защищена толстым слоем лака, на который обычно наносится красочная этикетка. В проигрывателе диск обращен этой стороной наружу. Противоположная (тыльная) сторона используется для считывания лазерным лучом. Луч проходит сквозь нее, так как основа диска — прозрачная пластмасса. Толщина диска 1.2 мм, внешний диаметр 120 мм, диаметр внутреннего отверстия 15 мм.

В проигрывателе имеется электродвигатель со следящей систе, мой, обеспечивающей точное считывание дорожки лазерным лучом и неизменную линейную скорость считывания. Поэтому скорость вращения диска непостоянна и изменяется от 500 об. / мин. для внутренней части диска, с которой начинается считывание, до 200 об. / мин. для внешней. Специальный оптико–электронный блок имеет устройства для стабилизации излучения лазера, автоматической фокусировки, слежения за дорожкой при биении диска и выбора треков диска для считывания.

Для считывания информации с CD–ROM используется полупроводниковый диод с фокусирующей и следящей оптической системой. Внутренняя поверхность диска, на которую кладут диск на подставку (в кассету) дисковода, находится не в фокусе оптической системы лазерного излучателя. Диаметр светового пятна от лазера, создающего сходящийся конус света, порядка 1 мм. Поэтому умеренные загрязнения нерабочей поверхности, например, пылинки на ней, отпечатки пальцев и даже небольшие царапины практически не влияют на воспроизведение. В отличие от привычных жестких магнитных дисков, диски CD–ROM можно заменять в считанные секунды. А ведь один диск CD–ROM по емкости равен примерно 500–м обычным гибким дискам формата 3.5“ на 1.44 Мбайт. Экономия на дискетах является немаловажным достоинством мультимедиа.

Проигрыватели компьютерных компакт–дисков, обычно называемые CD–ROM–драйвами, бывают двух типов: внешние (со своим корпусом) и внутренние — встраиваемые в системный блок компьютера. Последние напоминают накопители на гибких магнитных 5.25–дюймовых дискетах и имеют одинаковые с ним размеры.

На передней панели дисковода CD–ROM обычно имеется кнопка Eject для выброса или плавного выдвижения поддона, индикатор Busy (занято), гнездо для подключения стереотелефонов и регулятор громкости, используемый при проигрывании звуковых дисков.

Полноценное “вооружение” мультимедиа–ПК требует подключения к нему множества внешних устройств: аудио– и видеоадаптеров, телевизионных и радио–тюнеров, дисководов CD–ROM, джойстиков, клавиатуры MIDI и т.д. Все они обслуживаются массой программных утилит — драйверов и нередко конфликтуют друг с другом. В этой связи крупные разработчики ПК объединили усилия в создании стандарта Plug and Play (включай и играй). Этот стандарт — обширный комплекс программных и аппаратных средств по полностью автоматической настройке конфигурации компьютера в соответствии с используемым с ним оборудованием.

Технология PnP (или Plug’n’Play) предполагает, что достаточно включить компьютер, как все аппаратные и программные средства автоматически оптимально настроятся и станут работать без сбоев и конфликтов.

ИСПОЛЬЗУЕМАЯ ЛИТЕРАТУРА:

  1. С. Новосельцев “Мультимедиа — синтез трех стихий”. Компьютер–Пресс, 7’91.
  2. В. Дьяконов “Мультимедиа–ПК”. Домашний Компьютер, 1’96.
  3. “Звуковые платы” — по материалам зарубежной прессы, Copmuter Review, 7’96