Noções de codificação e compressão de som digital

Noções de codificação e compressão de som digital

Hoje em dia, a potência dos processadores aumenta mais rapidamente do que as capacidades de armazenamento, e muito mais rapidamente do que a banda concorrida das redes, porque isto exige enormes mudanças nas infra-estruturas de telecomunicações. A compressão de som digital é o artefacto utilizado para facilitar a transmissão (largura de banda) e o armazenamento (espaço físico) do som.

A compressão do áudio realmente consiste em duas partes. A primeira parte é a codificação, que transforma os dados do áudio digital, por exemplo, armazenados num arquivo/ficheiro WAVE, para dentro duma estrutura altamente comprimida denominada bitstream. A segunda parte é a descodificação, que lê o bitstream, reproduzindo-o na placa de som, e reexpande-o como um arquivo/ficheiro WAVE, porém não exactamente igual ao original.

Figura 1 - Ideia "caricaturada" de compressão do som.

Formatos de ficheiros de áudio:

AIFF (Audio Interchange File Format)

Este formato de som foi originalmente utilizado em computadores Apple e SGI (Silicon Graphics). Os ficheiros de som são armazenados num formato monoaural (mono ou de um canal) de 8 bits, que não é comprimido, podendo resultar em ficheiros de grande dimensão.

AU (UNIX Áudio)

Regra geral, este formato de ficheiro é utilizado para criar ficheiros de som para computadores UNIX ou para a Web.

MID ou MIDI (Musical Instrument Digital Interface)

Este é um formato padrão para o intercâmbio de informações musicais entre instrumentos musicais, sintetizadores e computadores.

MP3 (MPEG Áudio Layer 3)

Este é um ficheiro de som que foi comprimido utilizando o codec do MPEG Audio Layer 3, que foi desenvolvido pelo Fraunhofer Institute.

WAV (Wave Form)

Este formato de ficheiro áudio armazena sons em forma de ondas. Dependendo de vários factores, um minuto de som pode ocupar tão pouco como 644 kilobytes ou tanto como 27 megabytes de armazenamento.

WMA (Windows Media Áudio)

Este é um ficheiro de som que foi comprimido utilizando o codec áudio do Microsoft Windows Media, um esquema de codificação áudio digital desenvolvido pela Microsoft, que é utilizado para distribuir música gravada, normalmente através da Internet.

CODEC sem compressão e com compressão:

Um codec de áudio é um dispositivo de hardware ou um programa de computador que codifica/descodifica dados de áudio digital de acordo com um determinado tipo de arquivo de áudio ou áudio “streaming”. O objectivo do codec é representar os sinais de alta fidelidade do áudio com a quantidade mínima de bits, preservando ao mesmo tempo a qualidade. Isto pode efectivamente reduzir o espaço de armazenamento e a largura de banda exigidos para transmissão do arquivo de áudio armazenado.

Os codecs sem compressão ou sem perdas (exemplos: flac, shorten, wavpack e monkey’s áudio) são codecs que codificam som para comprimir o arquivo sem alterar o som original. Se o arquivo for descomprimido, o novo arquivo será idêntico ao original. Este tipo de codec normalmente gera arquivos codificados que são entre 2 a 3 vezes menores que os arquivos originais. São muito utilizados em rádios e emissoras de televisão para manter a qualidade do som ou imagem.

Fifura 2 - FLAC, exemplo de um codec sem compressão.

Os codecs com compressão ou com perdas (exemplos: Ogg, Vorbis, MP3, AC3 e WMA) são codecs que codificam som, gerando uma certa perda de qualidade com a finalidade de alcançar maiores taxas de compressão. Essa perda de qualidade é balanceada com a taxa de compressão para que não sejam criados artefactos perceptíveis.

Este tipo de codec foi criado para comprimir os arquivos de som a taxas de compressão muito altas. Por exemplo, o Vorbis e o Mp3 são codecs para som que facilmente comprimem o arquivo de som entre 10 a 12 vezes o tamanho original, sem gerar artefactos significativos.

Figura 3 - Ficheiro MP3 (codec com compressão) em reprodução.

Deixe um comentário