Jump to content

Polycom® Siren/G 722.1 に関する FAQ

G.722.1 とは何ですか?

1999 年 9 月 30 日に承認され、広範なテストを含む 4 年間の選定プロセスを経て、ITU-T Recommendation G.722.1 は最先端の国際標準ワイドバンド音声圧縮アルゴリズムになりました。 このテクノロジーは、第 3 世代の Polycom Siren 圧縮テクノロジーに基づき、ポリコムの現場で実証済みの PT716plus アルゴリズムから派生したものであり、 マルチメディアコミュニティ環境での多様な音声ニーズを満たします。 G.722.1 は、遅延と複雑さを抑えながら、低ビットレートで高品質の音声を実現し、 音声のみならず、音楽、声楽など、あらゆる音声信号に対応します。

トップに戻る

16 Kbps Siren とは何ですか?

16 Kbps Siren とは、G.722.1 標準規格を 16 Kbps で動作するように拡張したものです。

トップに戻る

ITU-T Recommendation G.722.1 の入手方法を教えて下さい。

G.722.1 の電子コピーは、ITU オンラインブックストア (http://www.itu.int/rec/T-REC-G.722.1/en) から直接購入できます。

ITU-T Recommendation G.722.1 の使用は、ポリコムとのライセンス契約締結が前提となっています。

トップに戻る

ITU-T Recommendation G.722.1 の内容を教えて下さい。

ITU-T Recommendation G.722.1 は、次の内容から構成されています。

  • ワイドバンド コーディング アルゴリズムの説明。
  • エンコーダおよびデコーダのリファレンス C コード。
  • テストベクトル (信号)。正しく実装されたことを検証する実装支援ツールです。

トップに戻る

G.722.1 の実装方法を教えて下さい。

まず、ITU-T から G.722.1 を購入します。 Recommendation G.722.1 には、アルゴリズムを実装するために必要なすべての情報が含まれています。 ハードウェアに実装した G.722.1 からの出力信号は、同じ入力信号を処理する場合、リファレンス C コードの出力信号と一致する必要があります。 標準規格で提供されるテストベクトルは、正しく実装されたことをテストする目的で設計されています。

エンコーダとデコーダの実装をテストするため、入力と出力、両方のテストベクトルがあります。 テストベクトルは、アルゴリズムをできるだけ多く実行するように作成されてるため、 出力テストベクトルを正しく再現できた場合、その実装はリファレンス C コードを正しく再現していると見なされます。

トップに戻る

G.722.1 のデモンストレーションプログラムをダウンロード

SirenZip は、Microsoft Windows オペレーティングシステムの Windows 95 以上で動作するプログラムです。 選択可能な 3 つのビットレート (16,000 Kbps 拡張、24,000 Kbps または 32 Kbps) の 1 つで G.722.1 を実行します。 SirenZip (ダウンロードサイズ 208 KB) の無料デモンストレーションプログラムをダウンロードして下さい。

SirenZip の使用方法

  • SirenZip は、ダウンロード直後から実行できます。
  • SirenZip.exe をダブルクリックし、次に [Siren Encode] をクリックして、正しい音源と出力ビットストリームファイルの名前を入力します。 正しいビットレートを選択し、[Play Wav Input] をクリックして入力ファイルを聞くか、[Encode Wave Input] をクリックし、G.722.1 を使用してファイルを圧縮します。
  • デコードするには、[Siren Decode] をクリックし、正しいビットストリーム ソース ファイルと音声出力ファイルの名前を入力します。 [Play Wav Output] をクリックして、G.722.1 でデコードされた出力ファイルを聞くか、[Decode Bitstream] をクリックし、G.722.1 を使用して音声出力を合成します。
  • 次に、SirenZip を使用する際の注意点を挙げます。
    • エンコーダは、モノラル wave フォーマットの音声入力ファイルのみを受け入れます。
    • デコーダの出力音声ファイルは、モノラル wave フォーマットです。
    • ビットレートはエンコーダで設定できますが、デコーダは正しく機能するビットレートを自動的に認識します。
    • 60 秒を超す音声入力ファイルは、60 秒までに切り捨てられます。
    • 音声入力のサンプルレートは、16,000 Hz または 22,050 Hz です。 入力が 22,050 Hz でサンプリングされた場合、SirenZip によって適切な 16 KHz にダウンサンプリングされるため、音声の忠実度が変化する可能性があります。 可能な限り 16 KHz のサンプリングを使用することをお勧めします。

トップに戻る

技術仕様

G.722.1 は、ITU-T 標準規格で固定小数点アルゴリズムとして指定されています。 浮動小数点バージョンは、ITU-T によって将来標準化され、固定小数点標準規格との相互運用性が維持される予定です。なお、ポリコムに相互運用可能な浮動小数点バージョンがあります。以下の MIPS 複雑度の数値は、3 つの異なる DSP タイプで最適化なしで実装された例です。 2 つの DSP は浮動小数点ユニットです。

一般的な G.722.1 のパラメータ

パラメータ

音声サンプルレート

16 KHz

ビットレート (フレーム境界でレートが変化することがあります)

16、24、32 Kbps (16 Kbps は標準規格に対するポリコムの拡張です)

音声帯域幅

 

50 Hz~7 KHz

音声フレームサイズ

 

20 ms

アルゴリズム遅延 (注 1 参照)

 

40 ms

 

RAM (固定小数点)

 

< 7.5 KB

ROM テーブルスペース (固定小数点)

 

~20 KB

 

エンコーダとデコーダの MIPS 比率

 

約 1 対 1

 

異なるプロセッサの MIPS 数値例

 

プロセッサ

MIPS (エンコーダ+デコーダ)

TI TMS320C50

 

13.9 (= 6.95+6.95) (固定小数点 G.722.1 用の非最適化コード)

 

TriMedia TM 1300

 

4 (= 2+2) (浮動小数点実装)

 

TI TMS320C31

9.25 (= 4.51+4.51) (浮動小数点実装)

 

トップに戻る

なぜワイドバンドなのですか?

従来の電話通信は、300~3500 Hz の範囲でのみ音声信号を渡すため、「ナローバンド」と呼ばれており、その帯域幅はわずか 3.2 KHz です。 帯域幅が狭いので、忠実度の高いシステムの豊かなワイドバンドの音に比べて、電話の通話音質は「金属的」になります。 G.722.1 は 7 KHz の音声帯域幅 (50~7000 Hz) を提供し、従来の電話の音質は大幅に改善されて FM ラジオの品質に匹敵します。 このため、明らかにナローバンドよりワイドバンドの音質が好まれています。

たとえば電話で話しているときに、「シー」と「フィー」を聞き間違えたことはありませんか? 高周波数の再生が不十分な場合、f と s の音の理解度が低下し、聞き分けが難しくなります。 ワイドバンドコーディングでは、音声に必要なすべての周波数が完全に表現されるので、このような混乱は起きません。

ワイドバンドを使用すると、オーディオ体験全般が非常に自然で耳に心地良いものとなります。

G.722.1 も、前例のない低ビットレートによる優れた音楽再生を実現します。 その音質は AM ラジオよりはるかに優れています。

トップに戻る

アプリケーション

G.722.1 および 16 Kbps Siren アプリケーションの例は、次のとおりです。

  • ワイドバンド IP テレフォニー
  • インターネット経由のストリーミング音声 (音楽を含む)
  • ビデオ会議
  • 音声会議
  • 音声ストレージの再生 (レコーダー)
  • メッセージングの保存と転送 (ボイスメール)
  • 音声対応 Web サイト

IP テレフォニー、ビデオ会議、音声会議の音声ニーズはよく似ており、遅延と複雑さを抑えた高い音声品質が求められます。 さらに、チャネル要件に応じたビットレートの変更機能も必須です。 G.722.1 では、20 ms フレーム境界で、24、32 Kbps、および Siren で拡張された 16 Kbps レート間でレートを変更できます。

ストリーミング アプリケーションでは、クライアント側の複雑さとコストを抑えることが絶対条件です。 G.722.1 は音質を損なうことなく、この条件を満たします。 16、24、32 Kbps のビットレートにより、クライアントは、V.90 (56 Kbps) モデム接続でも高品質の音声を楽しむことができます。

メッセージングは、保存および転送アプリケーションです。 複雑さを抑えることは、低コストのハードウェア実装を意味します。 高品質の音声圧縮により、送信者の声やミュージッククリップを優れた品質で再現できます。

トップに戻る

G.722.1 と Siren 16 Kkbps の音声を試聴

以下の .WAV ファイルをダウンロードして、G.722.1 の品質を実際に試聴して下さい

(これらのサンプルファイルは、どのコンピュータでも再生できる非圧縮 .WAV ファイルです。 再生に G.722.1 コーデックは必要ありませんが、結果的にダウンロードに時間がかかります)。

音声ファイル

ダウンロード

3.5 KHz 音声帯域幅、アナログ電話回線の音声品質

  speech_3p5kHz_mulaw.wav (ダウンロードサイズ 114 KB)

7 KHz 音声帯域幅、Siren により 16 Kbps でコード化

 speech_16kbps_siren.wav (ダウンロードサイズ 452 KB)

7 KHz 音声帯域幅、G.722.1 を使用して 24 Kbps でコード化

 speech_24kbps_g722p1.wav (ダウンロードサイズ 452 KB)

7 KHz 音声帯域幅、G.722.1 を使用して 32 Kbps でコード化

 speech_32kbps_g722p1.wav (ダウンロードサイズ 452 KB)

音楽ファイル

ダウンロード

3.5 KHz 音声帯域幅、アナログ電話回線の音声品質

  music_3p5kHz_mulaw.wav (ダウンロードサイズ 72 KB)

7 KHz 音声帯域幅、Siren により 16 Kbps でコード化

 music_16kbps_siren.wav (ダウンロードサイズ 286 KB)

7 KHz 音声帯域幅、G.722.1 を使用して 24 Kbps でコード化

 music_24kbps_g722p1.wav (ダウンロードサイズ 286 KB)

7 KHz 音声帯域幅、G.722.1 を使用して 32 Kbps でコード化

 music_32kbps_g722p1.wav (ダウンロードサイズ 286 KB)

トップに戻る

Windows Media Player、MP3 と Siren™ の比較

インターネットに低速 (ダイヤルアップモデムによる 28.8~56 Kbps のインターネットアクセスなど) でアクセスするユーザーは、Siren を使用すると低ビットレートで非常に優れたパフォーマンスを実現できます 。 以下の比較サンプルを試聴して下さい。

22 Kbps で 14 KHz 音声帯域幅の Siren と Windows Media Player (22 Kkbps で 44 KHz のサンプリングレートのみをサポート)* の比較

ビットレート

ダウンロード

ダウンロード

22 Kbps

 siren_22kbps.wav

 wmplayer_22kbps.asf

*Windows Media Player の帯域幅は許容可能なビットレートであり、44 KHz の高いサンプリングレートでのみ 20 KHz 音声帯域幅を再現できます。

24 Kbps で 14 KHz 音声帯域幅の Siren と MP3 (24 Kbps で最大 11 KHz の音声帯域幅) の比較

ビットレート

ダウンロード

ダウンロード

24 Kbps

 siren_24kbps.wav

 mp3_24kbps.asf

トップに戻る

H.320、H.323、H.324 システムの機能交換

G.722.1 を使用して異なるベンダー機器の相互運用を可能にするには、G.722.1 の機能交換とモード選択を標準化する必要があります。 H.320、H.323、H.324 システムに関するこれらの技術的側面は、ITU-T Study Group 16 によって定義されています。

ライセンス取得者は、ITU-T 標準規格に従って G.722.1 使用のネゴシエーションに必要なすべての情報を受け取り、標準規格であるポリコムの 16 Kbps 拡張をベンダー間で相互運用するための機能交換とネゴシエーションの手順も入手します。

トップに戻る

ITU とは何ですか?

ITU は、スイスのジュネーブに本部を置く国際電気通信連合です。 ITU は、世界で最も古い国際条約組織 (1865 年設立) であり、現在は国際連合の一部として電話、無線、データ通信を含む国際電気通信技術の標準化を担当しています。 詳細については、ITU の Web サイト (http://www.itu.int) (英語) を参照して下さい。

トップに戻る

テクノロジーに関する問い合わせ先

テクノロジーの詳細についてのお問い合わせは、SirenInfo@polycom.com までメールをお送り下さい。(英語のみ)

www.polycom.co.jp では、テレプレゼンス、音声、ビデオ会議製品およびソリューションに関する情報を提供しています。

〒102-0094, 東京都千代田区紀尾井町6-12 紀尾井町福田家ビル6階

© Polycom, Inc. All rights reserved.