음성 부호화 기술 [G.XXX]
작성일 2008-02-29
이미지
가 . 개요
o 사람의 음성 주파수는 70~7000Hz의 대역을 가지지만,
요해도를 해치지 않는 300~3400Hz를 음성대역으로하고, 보호대역 감안하여 8KHz로 표본화함.
o 음성신호를 디지털 신호로 부호화하는 방법에는
파형 부호화, 음원 부호화, 혼합부호화 방식이 있으며,
o 주요 기술은 PCM, ADPCM, SB-ADPCM, LD-CELP, CS-ACELP등이 있음.
나. PCM (G.711)
o G.711은 64Kbps PCM 기술을 이용한 음성부호화 방식의 표준이며,
1972년 ITU-T에 의해 권고됨.
o 파형 부호화 방식의 하나로,
아날로그 음성신호를 표본화, 양자화, 부호화하여 디지털로 전송하고,
수신측에서 복호화함으로써 아날로그 음성신호를 재생시키는 방식임.
o 양자화 잡음을 줄이기 위해 양자화 전에 압축하고,
복호화 후 신장하는 비선형 양자화 기법을 사용하는데,
북미 μ-Law 방식과 유럽 A-Law 방식이 있음.
다. ADPCM (G.721)
o G.721은 32Kbps ADPCM 기술을 이용한 음성부호화 및 압축방식의 표준이며,
1984년 ITU-T에 의해 권고됨.
o ADPCM은 음성신호의 시간 상관성이 큰 특성을 이용하여 입력신호와 예측 값과의
차이를 4비트 양자화 함으로써 전송 비트율 을 감소시킴.
o 적응 양자화기, 적응 예측기를 사용하여 PCM과 거의 동등한 음질을 얻음.
라. SB- ADPCM (G.722)
o Sub-Band ADPCM은 고품질의 현장감있는 음성통신을 위해
50Hz~7KHz 광대역을 64Kbps 이하의 고품질로 부호화하는 기술로서
1986년 ITU-T에 의해 G.722로 권고됨.
o 디지털 필터에 의해 저역(0~4 KHz)과 고역 (4~8kHz)으로 분할하여 처리 (ADPCM)한 후
다중화시켜 전송 (64kbps로) 함
o 음성 회의를 보완하는 멀티미디어 통신회의에 응용함.
마. LD-CELP (G.728)
o G.728은, 저속의 이동 통신을 위해 16Kbps로 부호화하면서도 G.721과 동등이상의 음질을
얻을 수 있다.
o LD-CELP (Low Delay - Code Excited Linear Prediction) 기술을 이용한 음성 부호화의 표준이며,
1992년 ITU-T에 의해 권고 됨.
o 인간의 청각 특성을 고려, 음성신호의 5샘플을 1 프레임으로 하는 10바이트만 전송함으로써
부호화 지연 2ms내에서 높은 음질을 구현함 (벡터 단위처리)
바. CS-ACELP (G.729)
o Conjugate Structure - Algebraic Code Excited Linear Prediction
o 8kbps 로 G.721 보다 음질이 좋음.
사. (G.723.1) MP-MLQ (Multi Pulse - Mucti Level Quantization)
o 6.3 Kbps로 G.721 보다 음질이 좋음
o 5.3 Kbps ACELP 방식도 있으나 음질은 떨어짐.
아. 상호 비교
표준
압축방식
속도
MOS
응용
G.711
PCM
64 Kbps
4.1
전화국간 디지털 전송
G.721
ADPCM
32 Kbps
3.85
가정 또는 기업의 CODEC
G.722
SB-ADPCM
64 Kbps
(오디오신호)
멀티미디어 음성회의. AM 방송 품질
G.728
LD-CELP
16 Kbps
3.61
디지털 이동통신, ISDN, FR망 음성용
G.729
CS-ACELP
8 Kbps
3.92
H.323, H.320 영상회의 단말.
이동통신, FR망 음성용
G.723.1
MP-MLQ
6.3 Kbps
3.9
이동통신, H.324 등 영상회의 단말
VOIP 포럼 추천
G.XXX
음성 통신 서비스용 오디오 압축/부호화 처리 기술에 대한 규정. G.711, G.722, G.723, G.728, G.729 등이 이에 속한다. 이중 G.723은 다른 규정에 비해 구현하기가 복잡하다는 단점에도 불구하고, 5.3/6.3Kbps의 높은 압축률을 자랑하기 때문에 인터넷 폰 음성 압축의 표준으로 자리잡고 있다.
G.711
64Kbps PCM 음성 코딩 기법을 규정한다. G.711에서 엔코딩된 음성은 PSTN에서나 PBX를 통해 디지털 음성 전달을 할 수 있는 올바른 포맷으로 만들어졌다. G-시리즈 권고의 ITU-T 표준에서 규정됐다.
G.723.1
H.324 계열 표준의 일부로 음성 신호나 오디오 신호 요소를 아주 낮은 비트 전송 속도로 압축하는데 사용할 수 있는 압축 기법을 규정한다. 이 CODEC에는 두 가지 비트 전송 속도, 즉 5.3Kpbs와 6.3Kpbs가 관련되어 있다. 높은 비트 전송 속도는 MLMLQ 테크놀로지를 기초로 하며 다소 높은 품질의 사운드를 제공한다. 낮은 비트 전송 속도는 CELP를 기초로 하고 있으며 시스템 설계자들이 좀더 융통성을 사용할 수 있다. G-시리즈 ITU-T 표준에서 규정됐다.
G.726
40Kbps, 32Kbps, 24Kbps, 16Kbps 등의 속도에서 이루어지는 ADPCM 코딩을 규정한다. PBX 네트워크가 ADPCM을 지원하도록 구성돼 있다면 ADPCM 엔코딩 음성을 패킷 음성 네트워크, PSTN 네트워크, PBX 네트워크 등의 사이에서 교환할 수 있다. G-시리즈 권고의 ITU-T 표준에서 규정됐다.
G.728
16Kbps로 진행되는 CELP 음성 압축의 시간 지연이 낮은 변이형을 규정한다. CELP 음성 코딩은 PSTN으로 또는 PSTN을 통해서 전달할 수 있도록 공공 텔레포니 포맷으로 변환해야 한다. G-시리즈 권고의 ITU-T 표준에서 규정됐다. G.729 음성을 8Kbps 스트림으로 코딩하는 CELP 압축을 규정한다. 이 표준에는 두 가지 변이형(G.729와 G.729 Annex A)이 있으며, 주로 계산상의 복잡성에서 차이가 있다. 두 가지 변이형 모두 32Kbps ADPCM과 비슷한 음성 품질을 지니고 있다. G-시리즈 권고의 ITU-T 표준에서 규정됐다.
출처: 소프트뱅크 - 온라인 아카데미
http://myhome.hanafos.com/~hwalkim/900/voice-encoding.htm
GSM610은 다대다 체팅엔 맞지않다.
그 이유는 여러명의 음성을 본인이 받을때 이것을 별도의 연산으로 믹싱내지는 다이렉트 사운드를 이용해서 여러명의 음성을 출력할때 압축이 풀린 PCM데이타를 필요로 하기 때문입니다... 위의 방법으로 압축 및 압축해제를 하면 내부적으로 그 과정이 일어나기 때문에 압축해제가 이루어진 PCM데이타를 얻지 못하기 때문입니다..