Modelo Fonte-Filtro

Um possível modelo para a geração de voz é o conhecido modelo Fonte-Filtro. Neste modelo distinguem-se dois componentes necessários: a fonte, que gera um sinal sonoro periódico ou ruidoso, e o filtro, que molda o sinal gerado pela fonte nas várias consoantes e vogais (ver figura 1).

Figura 1: Modelo fonte-filtro para geração de voz (excitação mista).
\begin{figure}\center
\input{fonte_filtro.pstex_t}\end{figure}

Embora o modelo para o filtro utilizado seja normalmente constituído só de pólos, o sinal de voz nem sempre é bem caracterizado por filtros deste tipo (principalmente quando o som é nasalado). Porém, se u[n] representar a função escalão unitário, repare-se:

h[n] = anu[n]  
H(z) = $\displaystyle \sum_{{n=0}}^{\infty}$anz-n = $\displaystyle \lim_{{N\rightarrow \infty}}^{}$$\displaystyle {\frac{{1-\left(az^{-1}\right)^N}}{{1-az^{-1}}}}$ = $\displaystyle {\frac{{1}}{{1-az^{-1}}}}$  
  $\displaystyle \Longleftrightarrow$ 1 - az-1 = $\displaystyle {\frac{{1}}{{\sum_{n=0}^\infty a^nz^{-n}}}}$  

Indicando que um zero pode ser visto como um número infinito de pólos (ou aproximado por um número finito). Por esta razão, um filtro só de pólos constitui uma aproximação razoável, desde que se use um número suficiente de pólos. Em média, o espectro da fala contém um pólo por kHz e, na prática, um filtro com um pólo por cada kHz na frequência de amostragem (normalmente soma-se mais um par de pólos extra) resulta razoavelmente bem. O sistema GSM usa uma aproximação de 8 pólos (para uma frequência de amostragem de 8kHz).


2003-11-27