본문 바로가기
멀티미디어

[멀티미디어] 4장 사운드 처리기술 : 사운드의 기본개념

by 의문의 효몽 2023. 10. 31.

사운드의 기본개념

소리가 전달 되는 과정

1. 음원에서 물체가 진동하면 공기압에 변화가 생기고 사운드가 생성
2. 이 변화는 파형(waveform)의 형태로 우리 귀에 전달
3. 사운드를 처리하는 것은 이러한 파형을 가공, 편집하는 것을 의미

사운드의 기본요소

  • 사운드 파형의 구성
    - 사이클(Cycle) : 일정 시간마다 반복되는 동일한 모양
    - 주기(Period) : 한 사이클이 걸리는 시간
                             어느 정도의 주기를 갖고 있는 사운드가 더 음악적으로 들림
  • 소리의 3요소
    - 주파수 : 음의 높낮이, Hz 
    - 진폭 : 음의 세기, dB 
    - 파형(Waveform) : 음색

1) 주파수 (Frequency) : 초당 사운드 파형의 반복 횟수

  • 소리의 높낮이를 결정 : 주파수가 높으면 고음, 낮으면 저음
  • 가청주파수(오디오) 20Hz~20KHz, 청각은 1K~6KHz에 제일 민감
  • 사람이 낼 수 있는 주파수 대는 약 100Hz~6KHz

 

2) 진폭 (Amplitude) : 사운드 파형의 기준선에서 최고점까지의 거리

  • 소리의 크기와 관련 : 진폭이 크면 큰소리, 작으면 작은 소리
  • 인간이 가장 편하게 들을 수 있는 소리의 범위는 0db ~ 90db

음의 크기와 소리의 예

  • 소리의 크기는 음압 변화의 비율로 표현
    - 사람의 귀는 소리 크기의 변화보다 변화의 비율(logarithm)에 영향을 받음
    - 소리의 크기를 표현 할 때에는 소리의 크기에 로그 값을 취한 bel로 표현하고, 사용 시에는 bel 값을 10배 한 decibel(dB)을 사용함
    - 기준 음압을 P0 (0.0002 µbar), 현재음압을 P라 하면, 음압 레벨 (dB ) = 10 x 2 log (P/P0)

 

3) 음색 (Tone Color) : 음의 높이와 크기가 같아도 악기마다 고유한 특징

  • 고유한 파형 => 기본파 + 고조파



디지털 사운드로의 변환

컴퓨터 처리를 위해 아날로그/디지털 형태 간의 변환

✓ ADC(Analog-to-Digital Converter)
✓ DAC(Digital-to-Analog Converter)

디지털 변환 과정

표본화, 양자화, 부호화 과정 필요

아날로그 신호와 디지털 신호 간의 변환 과정

 


1) 표본화(Sampling) : 아날로그 파형을 디지털 형태로 변환하기 위해 표본을 취하는 것

  • 표본화율(Sampling Rate)
    - 1초 동안에 취한 표본수 (단위: Hz)
    - 표본화율이 높을수록 원음을 잘 표현할 수 있으나 데이터 공간은 증가

  • 나이키스트 정리(Nyquist theorem)
    - 표본화 시 원음을 그대로 반영하기 위해서는 원음이 가지는 최고 주파수의 2배 이상으로 표본화 해야 한다
    - 음악 CD인 경우 표본화 율이 44.1KHz이고, 여기서 재생할 수 있는 최고 주파수는 22.05KHz임
    (사람의 귀는 20KHz 이상의 사운드는 감지할 수 없음)

 

2) 양자화 (Quantizing) : 어느 정도의 정밀도로 표현할 것인지, 표본화된 각 점에서 값을 표현하기 위해 사용되는 비트 수

  • 음의 해상도
    - 표본화하는 정밀도 (Sampling Resolution, Sampling Size)
    - 8 bit로 양자화를 하면 값을 256(28) 단계로 표현할 수 있지만, 16bit로 양자화를 하면 좀 더 세밀한 65536(216) 단계로 값을 표현할 수 있음

  • 표본화 및 양자화 정도에 따른 비교

 

3) 부호화 (Coding) : 표본화와 양자화를 거친 디지털 정보를 표현하는 과정

  • 사운드 파일은 크기 때문에 일반적으로 부호화 과정에서 압축하여 저장

디지털 사운드 파일의 크기 및 음질의 비교

  • 11.025 KHz × 8 bits × 1(mono) × 60 sec / 8 = 약 650 KBytes
    ……
  • 44.1 KHz × 16 bits × 2(stereo) × 60 sec / 8*1024 = 약 10.5 MBytes