動画と画像と音声の圧縮について・・・その3

やっと最後に音声だね。
音声は動画から画像データを除いた形で提供されるものが結構多いみたい。
例外はありますけどね。

音声

WAV(ウェーブ形式)
読み方 : ウェーブ
 Windows標準の音声ファイルの形式。「WAVE形式」などとも呼ばれる。音声信号をデジタルデータに変換したものを記録するための保存形式などを規定している。圧縮(符号化)方式については規定しておらず、任意のものを利用することができる。デフォルトではPCM(無圧縮)方式やADPCM方式などの圧縮方式に対応している。Microsoft社や他社が提供する「CODEC」と呼ばれるソフトウェアを追加することにより、MPEG-1 Audio Layer III方式(MP3)や、Indeo Audio形式などの様々な圧縮方式を利用することができるようになる。IT用語辞典e-wordsより。

MP3(エムピー3形式) 
読み方 : エムピースリー
フルスペル : MPEG Audio Layer-3
 映像データ圧縮方式のMPEG-1で利用される音声圧縮方式の一つ。
 人間の感じ取りにくい部分のデータを間引くことによって高い圧縮率を得る非可逆圧縮方式を採用しており、開発元の独Fraunhofer IISによれば、音楽CD並の音質を保ったままデータ量を約1/11(128kbps)に圧縮することができる。音質を犠牲にすればさらに高い圧縮率を得ることもできる。
 MPEG-1にはこの他にもLayer-1、Layer-2の音声圧縮方式があり、音質をほぼ保った場合の圧縮率はそれぞれ約1/4、約1/7である。MPEG-2やMPEG-4ではMP3に代わりAACという圧縮方式が採用されている。
 MP3には著作権保護機能がないため、市販のCDから音楽をパソコンにコピーして、MP3で圧縮、インターネットを通じて配布・交換する海賊行為が世界的に問題となっている。IT用語辞典e-wordsより。

AAC 【MPEG-2 Audio AAC】
読み方 : エーエーシー
フルスペル : Advanced Audio Coding
 映像圧縮規格MPEG-2またはMPEG-4で使われる音声圧縮方式。1997年4月にISO 13818-7として標準化された。最大サンプリング周波数は96kHzで、使用できるチャンネル数は最大48チャンネルである。MPEG-1に採用された音声圧縮方式であるMP3よりも1.4倍ほど圧縮効率が高く、音質はほぼ同じである。IT用語辞典e-wordsより。

WMA 
読み方 : ダブリューエムエー
フルスペル : Windows Media Audio
 Microsoft社が開発した音声圧縮方式。同社のWindowsなどに搭載されているマルチメディア技術「Windows Media」を構成する技術の一つで、同社製品の標準の音声圧縮方式である。
 人間の感じ取りにくい部分のデータを間引くことによって高い圧縮率を得る非可逆圧縮方式を採用している。同社によれば、音楽CD並みの音質を保ったまま約1/22(64kbps)まで圧縮することが可能で、音質を犠牲にすればさらに高い圧縮率を得ることもできる。
 Windows Media Rights Managerと呼ばれるコンテンツ管理システムを利用して暗号化することができ、音楽を有料コンテンツとして配布したり、海賊版がインターネットで配布されるのを防いだりすることができる。IT用語辞典e-wordsより。

ATRAC 
読み方 : アトラック
フルスペル : Adaptive TRansform Acoustic Coding
 MDなどに採用されている、ソニーが開発した音声圧縮技術。MDの登場とともに1992年から使われている。
 圧縮後のデータ量は、CD並みの音質ならCDの5分の1程度になる。このため、容量が約140MBのMDでもCD1枚分の楽曲を記録することができる。
 MP3と同様に、技術革新に伴って圧縮・再生方式に改良が加えられているが、データの互換性は保持されている(組み合わせによっては再生時に若干音質が落ちる場合もある)。
 ATRACでは、音声信号を帯域分割フィルタで4つの周波数帯域に分割する。その後、Modified DCT(変形離散コサイン変換)により時間ベースのデータ列から周波数ベースのデータ列に変換し、圧縮符号化する。
 その際、人間の聴覚の特性を利用して、聞こえにくい成分や大きな音の前後のデータを間引くことにより、音質を損なうことなく符号化するデータの量を減らしている。
 これらの原理の基礎は、その後登場したMP3などの音声圧縮と同じである。
 ソニーなどの音楽配信に使用されているATRAC3はATRACを改良した技術だが、データに互換性はない。IT用語辞典e-wordsより。

ATRAC3 
読み方 : アトラックスリー
フルスペル : Adaptive TRansform Acoustic Coding 3
 メモリースティックウォークマンなどに使われている、ソニーが開発した音声圧縮技術。同社のATRAC技術を改良したもの。
 ソニー製品を中心に、音楽配信サービスやMDLP(MDの長時間録音モード)などに採用されている。
 圧縮後のデータ量は、圧縮率によって4分の1から20分の1程度になる。CD並みの音質ならATRACのさらに半分の10分の1程度になるとされている。
 ATRAC3では、ATRAC同様、音声信号を帯域分割フィルタで4つの周波数帯域に分割する。その後、Modified DCT(変形離散コサイン変換)により時間ベースのデータ列から周波数ベースのデータ列に変換し、圧縮符号化する。
 その際、人間の聴覚の特性を利用して、聞こえにくい成分や大きな音の前後のデータを間引くことにより、音質を損なうことなく符号化するデータの量を減らしている。ATRAC3は、この間引きの判別精度をATRACの2倍に高めることにより、効果的な圧縮を可能としている。
 これらの原理の基礎は、その後登場したMP3などの音声圧縮と同じである。
 音楽業界によって推進されているSDMIプロジェクトでは、著作権を保護したまま楽曲データの流通を行なうための技術仕様を策定しているが、ATRAC3を圧縮方式の一つとして採用することを検討している。IT用語辞典e-wordsより。

AIFF 
読み方 : アイフ
フルスペル : Audio Interchange File Format
 Apple社が開発した音声ファイルのフォーマット。同社のパソコンMacintoshシリーズの標準フォーマットである。ステレオにもモノラルにも対応している。IT用語辞典e-wordsより。

音声の圧縮方式はサンプリングレートと音数で決まるのでそれほど多様性はない模様。最近は著作権保護機能をどう実装するかが一つのテクノロジーの鍵になっているらしい。

PCM 
読み方 : ピーシーエム
フルスペル : Pulse Code Modulation
 音声をデジタルデータに変換する方式の一つ。音を一定時間ごとに数値化(サンプリング)して記録する。記録されたデジタルデータの品質は、1秒間に何回数値化するか(サンプリング周波数)と、データを何ビットの数値で表現するか(量子化ビット数)で決まる。音楽CD(CD-DA)はPCM方式を利用しており、サンプリング周波数44.1kHz(1秒間に44100回の数値化)、量子化16ビット(0~65535の65536段階で音声データを表現)である。IT用語辞典e-wordsより。

MIDI 
読み方 : ミディ
フルスペル : Musical Instruments Digital Interface
 シンセサイザや音源とパソコンを接続して楽曲データをやりとりするための規格。音色、音程などのデータを送受信する手順が定められている。楽器の種類などに関するデータ形式をより厳密に定義したGM規格が業界標準として広く普及している。IT用語辞典e-wordsより。

GM 
読み方 : ジーエム
フルスペル : General MIDI
 MIDI規格で扱われるデータの意味をより厳密に定義した規格。多くのMIDI機器が対応しており、事実上の業界標準となっている。従来は音源の種類によって同じデータでも演奏に使われる楽器が違うなど、相互運用性に問題があったが、GMに対応した機器では、基本的には同じデータで同じ演奏が得られるようになっている。ただ、同じ音色を指定しても音源メーカーによって音の調子が微妙に異なる場合もあり、メーカー間で完全に互換性があるとは言えない。GMでは音色を128種類しか指定できないため、ローランドのGS規格やヤマハのXG規格など、GMを独自に拡張した規格も存在する。IT用語辞典e-wordsより。

PCMはCDの記録方式。GMに代表されるMIDI形式は実際に音を録音しているというよりは楽譜をデータ化して、おのおののPCのサウンドボード上のデバイスを鳴らして音をだす規格と思えばそれほど間違いはないだろう。

大事なとこはこんなものかな。次はおまけだよ。
[PR]

by yukrid71 | 2005-07-01 00:42 | PC