Protocolos de sinalização Voz sobre IP II

No artigo passado falamos sobre o protocolo de sinalização H.323. Hoje falaremos sobre o protocolo de sinalização SIP.

O SIP (i.e. Session Initiation Protocol) é um protocolo de sinalização multimédia P2P (i.e. Peer-To-Peer) estabelecido primeiro pela RFC (i.e. Request for Comments) 2543 e depois na RFC 3261 pelo grupo MMUSIC (i.e. Multiparty Multimédia Session Control) do IETF, e pode ser utilizado em conjunto com outros protocolos tais como e-mail, serviços de Voice Mail, Web, conferências multimédia e colaborativas, e mensagens instantâneas, por funcionar na camada de aplicação.

A sua flexibilidade permite que seja utilizado em conjunto com múltiplos dispositivos de midia, fabricados por diversos fornecedores. O facto de ser um protocolo ponto-a-ponto actuando no modelo cliente/servidor, permite que sejam estabelecidas sessões entre dispositivos diferentes, como telefones celulares e computadores pessoais ou PDA’s (i.e. Personal Digital Assistants).

Vantagens

O protocolo SIP as vezes tem sido difícil de entender, por ser um protocolo diferente de outros que já haviam sido estabelecidos. Essa confusão entretanto esconde as grandes vantagens deste protocolo de sinalização, por ser um protocolo que foi estabelecido para ser independente e permitir interoperabilidade de dispositivos e serviços. Algumas destas vantagens são as seguintes:

  • Não possui um protocolo de transporte específico. As mensagens podem ser transportadas tanto pelo protocolo UDP, TCP, RTP ou SCTP (i.e. Stream Control Transmission Protocol).
  • Não possui funções específicas para qualidade de serviço. Permite por isso que seja usado por um modelo a escolha, tal como DiffServ ou IntServ que analisaremos mais a frente.
  • Não possui funções específicas para segurança. Permite por isso que seja usado por um protocolo a escolha tal como IPSec (i.e. Internet Protocol Security) ou TLS (i.e. Transport Layer Security).
  • Protocolo independente na camada de aplicação. Ele apenas define métodos para controlo de sessões, mas não define que aplicações e serviços usarão estas sessões.


Arquitectura

A figura abaixo define a arquitectura SIP:

Imagem

O SIP é composto pelos seguintes componentes:

User Agent (UA) – Terminal SIP que pode ser um telefone, Gateway, Sistema de Mensagens e actuar como cliente ou servidor. Estão divididos em UAC e UAS:

  • User Agent Client (UAC) – UA responsável pelo inicio da sinalização.
  • User Agent Server (UAS) – UA responsável por responder a sinalização do UAC.

Servidores SIP – Realizam diversas funções para os clientes, como localização e redireccionamento. Estão divididos em:

  • Servidor Proxy – Recebe pedidos do UA e envia para outras localizações como por exemplo outro servidor Proxy se este UA não estiver sob a sua administração.
  • Servidor de Localização – Recebe pedidos de localização do UA e actualiza a base de dados de localização.
  • Servidor de Redireccionamento – Recebe pedidos do UA e responde com uma lista de localizações, para que o UA possa contactar directamente o destinatário.

Um usuário SIP pode ser identificado e localizado por intermédio duma URI. O formato da URI é o seguinte:

sip:usuário:palavra-passe@host:porta;parâmetros-URI?cabeçalhos

Onde:

  • Usuário – Identificador tradicional que pode ser um nome ou numero, ou conjunto deles que serve para referir-se a um recurso num host[1].
  • Palavra-Passe – Palavra-Passe associada a um determinado Usuário.
  • Host – Pode ser um domínio ou endereço de rede numérico que aponta a um dispositivo.
  • Porta – O canal do host. Um valor numérico.
  • Parâmetros-URI – Instruções que podem ser passadas.
  • Cabeçalhos – Especificam determinados parâmetros como emissor e destinatário.

Exemplos desse formato, seriam:

nataniel.baiao@snnangola.com,nataniel.baiao@192.168.1.1, nataniel.baiao@snnangola.com:8080, nataniel.baiao@192.168.1.1:8080.

Pela figura acima verifica-se que um agente comunica-se com outro agente por meio dum servidor proxy SIP. A comunicação pode depois ser estabelecida directamente. Para que um terminal SIP possa estabelecer comunicação com outro terminal mas de uma sinalização diferente, é necessário a presença duma Gateway para que se possa fazer a conversão da sinalização SIP para a sinalização H.323, por exemplo. No entanto, diferente do protocolo H.323 no protocolo SIP uma Gateway pode ser um UA. Entretanto a informação de voz e vídeo não sofre alterações.

A única situação onde existem alterações, na sinalização e na informação de média é quando se realiza a conversão de sinalização SIP à PSTN, pois ali estamos a falar de redes que utilizam dois tipos de comutação diferentes, isto é por pacotes e por circuitos.


[1] É um computador conectado a rede que oferece informações e serviços a usuários.

Protecção e redundância de Links em cortes de meios de transmissão ópticos I

Quando o fluxo de dados num meio de transmissão guiado como um cabo de fibra óptica é interrompido, recorrem-se a técnicas de  protecção de tal modo que os usuários finais não sintam os efeitos da interrupção  até que a junção do cabo seja novamente realizada.

Continuidade de serviços em caso de falhas é um factor importante nas redes Multi-Serviços. Serviços críticos não podem ser interrompidos por causa da falha duma interface numa carta (IOC, SPC). Neste contexto é extremamente recomendável prover protecção de interfaces tributárias.

Cisco ONS 15454 SDH Multiservice Provisioning Platform (MSPP) com diversas cartas e interfaces

Cisco ONS 15454 SDH Multiservice Provisioning Platform (MSPP) com diversas cartas e interfaces

 

Quando se fala em protecção, interessa-nos falar em protecção de equipamentos e protecção do anel.

 

A protecção de equipamentos

É importante, já que uma MSPP é um equipamento crítico na rede que fornece conectividade a vários outros como comutadores e encaminhadores. Ela é realizada duplicando as cartas e a ligação entre elas. Alguns destes esquemas de protecção são os seguintes:

  • 1:1 – Uma única carta de protecção não activa, protege uma carta activa. Se a carta activa falha ou é removida, o tráfego comuta para a carta de protecção.
  • 1:N – Uma única carta de protecção não activa, protege múltiplas cartas activas. Como no caso do esquema 1:1, este esquema é muito usado para protecção de interfaces TDM de domínio eléctrico.
  • 1+1 – Este é um esquema de protecção óptica, onde uma carta ou porta não activa protege uma única carta activa ou porta numa carta multi-porta.

Protecção de interfaces de camada superior

Tal como cartas Ethernet nativas, estas estão geralmente desprotegidas. Elas podem ser protegidas instalando cartas separadas a 100Mbps ou até mesmo no padrão Gigabit Ethernet[1] com ligações a um comutador ou encaminhador. É realizado então balanceamento de tráfego entre o MSPP e o comutador ou encaminhador.

Proteccao por Topologias

As topologias são muito importantes no desenvolvimento duma rede Multi-Serviços, já que elas determinam como o esquema de protecção do anel será realizado e a capacidade total de transporte de payload (i.e. Carga ou informação útil). Diversas topologias podem ser adoptadas, com diferentes níveis de resiliência e capacidade transporte de tráfego.

Topologia Linear

Topologias lineares são geralmente usadas quando o tráfego é encaminhado entre dois nós, num modo ponto-a-ponto ou ponto-a-ponto mas com inserções e extracções de tráfego ao longo do caminho. A figura abaixo ilustra essa topologia:

 

Topologia Linear 01

Topologia Linear

 

No cenário acima, cada nó necessita de duas interfaces ópticas que podem estar em cartas separadas ou em diferentes portas ou interfaces ópticas na mesma carta multi-porta. Este tipo de protecção 1+1 faz com que se uma das interfaces e sua fibra de serviço em qualquer nó é activada a outra interface é considerada inactiva e serve como interface de protecção. Se ocorre uma falha na interface activa, a interface inactiva de protecção, assume o tráfego.

Aconselha-se, por motivos de diminuição de riscos a manter-se sempre as interfaces activa e inactiva de protecção, em cartas diferentes.

Tratando-se de uma cadeia de inserção/extracção de tráfego para outro nó, um nó necessitará sempre de quatro interfaces. Duas delas para a zona Este e as outras duas para a zona Oeste. Nas duas zonas uma delas será Interface activa e outra, interface de protecção como ilustra a figura abaixo:

Topologia Linear com cadeia de inserção extracção 02

Topologia Linear com cadeia de inserção extracção



Topologia UPSR (Unidirectional Path-Switched Rings)

Este tipo de topologia, usa um esquema de protecção 1+1, de tal forma que o tráfego originado num determinado nó é enviado simultaneamente pela interface e fibra activa no sentido horário e pela interface e fibra de protecção no sentido anti-horário, conforme ilustra a figura abaixo:

Topologia UPSR 03

Topologia UPSR

Este tipo de topologia unidireccional, é recomendado nos casos em que é necessário que um conjunto de circuitos necessita de ter um ponto comum de escoamento de tráfego.          Um exemplo disso seria uma rede corporativa[2] com uma rede privada[3] em que um conjunto de filiais tem acesso a Internet[4] a partir da sede.

Topologia MS-SPRING (Multiplex Section Shared Protection Ring)

Na terminologia SONET, esta topologia é conhecida como BLSR (i.e. Bidirectional Line Switched Ring). Ela divide-se em duas categorias: anéis de duas fibras, e anéis de quarto fibras. Estes anéis são bidireccionais. Outra diferença fundamental, entre esta topologia e a topologia UPSR é que a MS-SPRING não é limitada pela capacidade de débito binário do anel.

No caso do MS-SPRING de duas fibras, um par de fibras ópticas é usado para ligar os nós MSPP tal como na topologia UPSR. No entanto, aqui o tráfego da origem ao destino é encaminhado em apenas uma direcção ou pela rota Este ou pela Oeste. Na direcção oposta é mantida capacidade sobressalente de débito binário para reserva em caso de falha, ou seja, metade do débito binário é atribuído ao tráfego activo ou de serviço e a outra metade é mantida em reserva para fins de protecção, como ilustra a figura abaixo:

Topologia MS-SPRING de 2 fibras 04

Na figura 2.10 é atribuída cerca de 5Gbps para cada direcção. Um SONET OC-192 equivale a um SDH STM-64 ou mais precisamente 10Gbps.

Topologias MS-SPRING de 4 fibras duplicam o débito binário de topologias MS-SPRING de 2 fibras, com a desvantagem de requererem custos adicionais e recursos de instalação mais complexos. Entre nós adjacentes, são necessárias quatros fibras ou dois pares de fibras.
Duas dessas fibras são utilizadas como fibras activas ou de serviço e as outras duas são utilizadas como fibras de protecção. Neste caso o débito binário completo, por exemplo um OC-192 ou SDH STM-64 é atribuído as duas fibras activas ou de serviço, como ilustra a figura abaixo:

Topologia MS-SPRING de 4 fibras 05

Se entre dois pares de fibras num segmento acontecer algum problema tal como um corte, uma comutação rápida é realizada para outro par de fibras no mesmo segmento, como ilustra a figura abaixo, onde dois pares de fibras de serviço entre os nós 1 e 2 foram afectados por alguma falha grave:

Comutação de Fibra em topologia MS-SPRING de 4 fibras 06

Por outro lado se acontece algum problema nos dois pares de fibras num segmento uma comutação de anel é realizada como ilustra a figura abaixo:

Comutação de anel em topologia MS-SPRING de 4 fibras 07
Fontes:[1] DURKIN, Jim; GOODMAN, John; HARRIS, Ron; FERNANDEZ-POSSE, Frank; REZEK, Michael; WALLACE, Mike.

Building Multiservice Transport Networks

Cisco Press, USA, 13 Julho, 2006.

[2] BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço, UCAN]


[1] Entrega débitos binários na ordem dos 1 Gigabits por segundo

[2] Rede pertencente a uma corporação. Mesmo separada geograficamente é vista como uma só.

[3] Rede cujos dados não são interpretáveis do fora da rede corporativa.

[4] Rede mundial de computadores

Protocolos de sinalização Voz sobre IP I

No artigo passado falamos de cálculos de consumo de débito binário em redes VoIP.

A sinalização numa rede VoIP tem uma importância crucial. Ele serve para controlar o estabelecimento e as características das chamadas de voz.

Ela serve, por exemplo, para que o terminal de um assinante chamador determine o estado do terminal do assinante receptor determinando se está ocupado ou livre. Se estiver livre o protocolo de sinalização estabelece a ligação entre os dois assinantes. Quando um deles termina a ligação, o protocolo de sinalização é responsável por indicar esse término e liberar os recursos que estavam sendo usados.

Analisaremos dois protocolos de sinalização: O H.323 da ITU-T e o SIP do IETF (i.e. Internet Engineering Task Force).

O protocolo H.323

Este protocolo foi projectado com o intuito de servir redes multimédia locais com suporte a voz, vídeo e dados em redes de comutação em pacotes sem garantias de Qualidade de Serviço(em Inglês Quality of Service ou QoS).

Devido a debilidades das versões iniciais do protocolo, novas versões foram sendo aprovadas permitindo suporte a redes alargadas e a garantia de Qualidade de Serviço. O protocolo H.323 vem sofrendo diminuições na sua adopção em favor do protocolo SIP do IETF.

Arquitectura

A arquitectura do H.323 pode ser visualizada na figura abaixo:

protocolo h.323

Protocolo H.323

 

A arquitectura H.323 é composta por zonas. No exemplo da figura 3.6 temos apenas duas zonas, ZONA 1 e ZONA 2, embora possam existir mais zonas.

Componentes do Sistema

O H.323 é composto pelos seguintes componentes:

 

  • Gateway (GW) – Na rede H.323 este dispositivo prove comunicação entre um terminal duma rede PSTN (i.e. Public Switched Telephone Network) ou Rede Publica de Telefonia Comutada, a um terminal duma rede de comutação em pacotes.

 

  • Multipoint Control Unit (MCU) – Serve para permitir conferencias multiponto, isto é entre dois ou mais terminais.

 

  • Gatekeeper (GK) – Tem funções de tradução de endereços e gestão de largura de banda. Prove também controlo de acesso aos Terminais, Gateway’s e MCU’s.

 

  • Terminal H.323 (TE) – Serve para prover comunicação em dois sentidos em tempo real. Esta comunicação pode ser tanto entre dois TE como entre um TE e um GW ou um MCU. Este terminal possui capacidades de transmissão de áudio, vídeo e compartilhamento de dados. Um TE pode ser um telefone, ou mesmo um software de chamadas de voz instalado num computador pessoal.

 

Estabelecimento duma ligação H.323

 

Durante o estabelecimento duma ligação entre dois terminais, utilizando o super-protocolo H.323, sete fases são realizadas usando diversos sub-protocolos[1] H.323.

 

  • Fase 1 – Nesta fase o protocolo RAS (i.e. Registration, Admission and Status) é utilizado. O TE chamador solicita permissão ao GK para realizar e receber chamadas. O TE chamador recebe o endereço IP do TE chamado. O protocolo RAS é utilizado para que um elemento H.323 como um TE ou GW descubra, registe e desfaça o registo de um GK e operações da Fase 1 já vistas.

 

  • Fase 2 – Nesta fase a chamada entre os dois TE é estabelecida. O TE chamador recebe o endereço H.245 do TE chamado. Nesta fase, o protocolo Q.931 é utilizado. O protocolo H.245 é utilizado para realizar negociações entre dois elementos H.323 tais como capacidade de processamento e propriedades de Codec’s. O protocolo Q.931 é utilizado para estabelecimento e finalização de ligações entre dois TE H.323.

 

  • Fase 3 – Nesta fase são estabelecidas negociações entre os elementos. O protocolo H.245 é utilizado para determinar a relação mestre/escravo entre eles e negociação de capacidades. Os canais lógicos entre os elementos são estabelecidos.

 

  • Fase 4 – Esta é a fase de conversação entre os elementos. O protocolo RTP (i.e. Real-time Transport Protocol) é utilizado. O protocolo RTP que será estudado mais a frente é um protocolo que serve para o transporte em tempo real de voz numa rede IP.

 

  • Fase 5 – O protocolo H.245 é novamente utilizado. Desta vez para fechamento dos canais lógicos, previamente estabelecido.

 

  • Fase 6 – O protocolo Q.931 é utilizado para fechamento da ligação.

 

  • Fase 7 – O protocolo RAS é utilizado para liberar a ligação e consequentemente os recursos como por exemplo débito binário que ela estava utilizando.

 

Fonte: BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço, UCAN]


[1] Protocolos que funcionam sobre um protocolo

Determinaçao do consumo de débito binário em Voz sobre IP

No artigo passado realizamos uma pequena introdução sobre a tecnologia VoIP. No artigo de hoje pretendemos pois, abordar aspectos basilares relacionados ao consumo de debito binário tão escassos e necessários para a tecnologia VoIP.
Como dizíamos, o consumo de débito binário nesta tecnologia é um factor importante porque os recursos de débito binário numa rede de comutação de pacotes são sempre escassos.

Em Angola até este ano muitos provedores de serviço oferecem como débito binário para ligações em feixes Hertzianos no máximo 512kbps. Alguns provedores a cabo oferecem no máximo 8Mbps. Considere a rede da figura abaixo.

Mudança de sinalização VoIP

Fig 1.1: Mudança de sinalização VoIP

Supondo que cada telefone possui um débito binário de 64kbps, se não fossem aplicadas técnicas de controlo de consumo de débito binário teríamos de compartilhar este débito binário, o que daria cerca de  512kbps / 32 = 16kbps por cada terminal supondo que todos estão a comunicar ao mesmo tempo. Para garantir débito necessário pode-se recorrer a técnica de compressão de pacotes.

As técnicas de controlo de consumo de débito binário em ambientes VoIP dependem também do tipo de Codec utilizado.

O Codec é o componente necessário para transformar o sinal de voz analógico em digital e é implementado por meio de PDS’s (i.e. Processadores Digitais de Sinais) em Gateway’s da rede VoIP.

Para melhor determinação do débito binário, são necessários conhecimentos do consumo de débito binário por cabeçalho na camada de transporte. A tabela 1.1 possui os valores e consumo em bytes:

Tabela 1.1: Consumo de débito binário por protocolo em bytes

Cabeçalho ou Protocolo Consumo em Bytes
IP (Internet Protocol) 40
TCP (Transport Control Protocol) 20
UDP (User Datagram Protocol) 8
RTP (Real-time Transport Protocol) 12
cRTP (compressed Real-time Transport Protocol) 2 ou 4
MP (Protocolo Multilink Ponto-a-Ponto) ou Protocolo Frame Relay fórum (FRF).12 6
End-of-Frame no protocolo MP e frames do Frame Relay 1
Cabeçalhos Camada 2 no Protocolo Ethernet 18
Frame Check Sequence (FCS) ou Cyclic Redundancy Check (CRC) 4

Existem expressões para o cálculo do consumo de débito binário duma rede usando um determinado Codec. Algumas delas são as seguintes:

  • Tamanho Total do Pacote = (Cabeçalho Camada 2: MP ou FRF.12 ou Ethernet) + (Cabeçalho IP/UDP/RTP) + (Tamanho do Payload de Voz).      (Eq. 1.1)
  • Taxa de bit do Codec = (Tamanho da Amostra do Codec) / (Intervalo da Amostra do Codec).      (Eq. 1.2)
  • PPS (Pacotes Por Segundo) = (Taxa de bit do Codec) / (Tamanho do Payload de Voz).     (Eq. 1.3)
  • Largura de Banda Por Chamada = Tamanho Total do Pacote * PPS.            (Eq.3.6)

Onde:

  • Taxa de bit do Codec – É o número de bits por segundo necessários para encaminhar uma chamada de voz. É medido em kbps.
  • Tamanho da Amostra do Codec – É o número de bytes capturado pelo a cada intervalo de amostragem. É medido em bytes.
  • Intervalo de Amostragem do Codec – É o intervalo de amostragem que o Codec trabalha. É medido em ms (milissegundos).
  • Payload de Voz – É a representação da informação dentro do pacote. Necessita de ser um múltiplo do Tamanho da Amostra do Codec. É medido em bytes. O Payload de Voz também pode ser medido em ms quando se leva em conta a duração das amostras do Codec.
  • PPS – É o número de pacotes que precisam ser transmitidos por segundo em relação a taxa de bit do Codec e o número de bits por pacote.

Exemplo 1: Determinar a largura de banda por chamada necessária para um terminal que use o Codec G.728 com Tamanho da Amostra do Codec de 10 bytes e Intervalo da Amostra do Codec com duração de 5ms. Considere usar a compressão RTP e MultiLink Protocol.

Resolução:

É necessário determinar o tamanho total do pacote.

  • Tamanho Total do Pacote = (6 bytes do cabeçalho MP) + (2 bytes de Cabeçalho RTP comprimido) + (60 bytes de Payload de Voz) = 68 bytes = 544 bits
  • Taxa de bit do Codec =  10 bytes / 5ms =(10 * 8 bits * 10^3) / 5s =16kbps
  • PPS (Pacotes Por Segundo) = 16kbps / 60 bytes = 33.33 pps
  • Largura de Banda por Chamada = 544 bits * 33.33 pps = 18.4kbps

Cada Codec Adapta-se a uma determinada circunstância. Existem vários fabricantes de Codecs. Este projecto tem um forte enfoque em ambientes Cisco Systems®, por causa de sua popularidade e pelo facto de a maior parte dos simuladores virem dotados de ferramentas deste fabricante. A Cisco Systems® tem vários Codecs habilitados nos seus equipamentos. A tabela 1.2 torna desnecessário realizar cálculos como aqueles que realizamos acima. Esta tabela contem todos os dados necessários para determinar o Codec exacto a utilizar no nosso ambiente ou rede VoIP:

Tabela 1.2: Tabela de Codec’s e seus diversos parâmetros

Tabela codecs e seus diversos parametros

Tabela de codecs e seus diversos parâmetros

Conforme se viu em Exemplo 1, 18.4 kbps por chamada, mesmo usando compressão de cabeçalho RTP é um valor alto para as necessidades da rede da figura 1.1.

A qualidade dum Codec é também determinada pela avaliação MOS (i.e. Mean Opinion Score). O MOS é uma avaliação realizada em relação a uma resposta subjectiva dum ouvinte. Vários Codecs são colocados em avaliação e os ouvintes dão uma avaliação na escala MOS de 1 a 5 conforme a tabela 1.3.

Tabela 1.3: Score MOS

Score

Definição

Descrição

5

Excelente

Um sinal de voz perfeito gravado em um local silencioso

4

Bom

Qualidade de uma chamada telefónica de longa distância (PSTN)

3

Razoável

Requer algum esforço na escuta

2

Pobre

Fala de baixa qualidade e difícil de entender

1

Ruim

Fala não clara, quebrada

Pela tabela 1.4 os melhores resultados são avaliados consoante a média da avaliação dada pelos ouvintes:

Tabela 1.4: Avaliação do MOS a Métodos de compressão

Método de Compressão

Taxa de bit (kbps)

MOS

Atraso (ms)

G.711 PCM

64

4.1

0.75

G.726 ADPCM

32

3.85

1

G.728 LD-CELP

16

3.61

3 a 5

G.729 CS-ACELP

8

3.92

10

G.729 x 2 Encodings

8

3.27

10

G.729 x 3 Encodings

8

2.68

10

G.729a CS-ACELP

8

3.7

10

G.723.1 MP-MLQ

6.3

3.9

30

G.723.1 ACELP

5.3

3.65

30

O Codec G.711 recebeu a melhor avaliação, embora o Codec G.729 seja melhor opção por ser aquele que consegue um bom equilíbrio entre o consumo de débito binário e um bom MOS.

Fonte: BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço, UCAN]

Introdução a Voz sobre IP

Ao contrário dos sistemas de telefonia pública em comutação de circuitos, a tecnologia  de voz sobre IP VoIP(Voice over IP) utiliza a comutação de pacotes para a transmissão de voz. A voz acústica é digitalizada e embutida num pacote VoIP. O VoIP utiliza datagramas[1] IP para o transporte dos pacotes. O cabeçalho dum pacote VoIP é ilustrado na figura a seguir:

cabecalho voip

Cabeçalho VoIP

Notemos que o cabeçalho depende do tamanho do Codec de voz, mas apenas sem o tamanho o mesmo já tem 40 bytes[2]. O Codec G.729 sem compressão, possui 20 bytes. Isso faz com que o pacote possua 60 bytes, uma sobrecarga desnecessária no ambiente de voz. Mais adiante falaremos de técnicas para controlar estes inconvenientes.

O protocolo TCP (i.e. Transport Control Protocol) não é recomendado para esse transporte, porque é um protocolo com garantia de entrega que baseia-se na confirmação do emissor e retransmissão em caso de perca de pacotes. Essa retransmissão pode acarretar problemas de atraso na comunicação, num ambiente que necessita de ser totalmente interactivo.

O protocolo UDP (i.e. User Datagram Protocol) ao contrário não possui garantia de entrega de pacotes e possui um cabeçalho menor em relação ao protocolo TCP. A figura abaixo ilustra como é feita a conversão da sinalização da voz da rede de comutação de telefonia pública para sinalização da rede de comutação em pacotes e sua transmissão:

Mudança de sinalização VoIP

Pela figura acima, um terminal realiza uma chamada a uma rede remota utilizando a rede global conhecida como Internet. A Gateway[3] atrás da Internet realiza a conversão da voz em comutação de circuitos para comutação de pacotes e a Gateway do outro extremo realiza conversão de sinalização inversa, isto é de pacotes para circuitos.

Nos Backbone’s na Internet é necessário garantir que o atraso seja o mais constante possível e não exista variação de atraso de modo a garantir uma comunicação com qualidade. Por isso são necessárias técnicas de Engenharia de Tráfego e Qualidade de Serviço, conforme veremos nos capítulos a frente.


Fonte: BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço, UCAN]

[1] Informação sendo transportada na camada de transporte do modelo OSI

[2] 1 byte equivale a 8 bits

[3] Dispositivo de fronteira entre redes e/ou tradução de protocolos.

O processo de Digitalização da Voz

Para entender melhor a razão técnica da adopção do VoIP é necessário perceber bem o processo de Digitalização da Voz, até chegar ao VoIP. Comunicações analógicas, sempre foram usadas nas transmissões. No entanto por causa da sua falta de eficiência, sentiu-se a necessidade de se adoptar outra técnica de transmissão.

Um dos motivos que levou a isso foi os demasiados erros de transmissão que as transmissões analógicas comportam. Com o aumento da distância na transmissão de informação, a amplitude do sinal degrada, tornando difícil, separa-lo do ruído de transmissão. Quando o sinal é amplificado, o ruído também é amplificado, tornando a informação irreconhecível.

A forma de onda da comunicação digital foi modulada de tal forma que existam apenas dois estados binários, o Zero e o Um. Dessa forma é mais simples separa-lo do ruído de comunicação.

A conversão do sinal analógico para o digital, comummente usada em ambientes tradicionais de voz é a Modulação Codificada por Pulsos o PCM (i.e. Pulse Code Modulation) definido pela ITU-T G.711.

Faixa de frequências

O domínio das frequências de voz está situado entre os 8 Hz a 12kHz. Na banda entre os 150 Hz e 8kHz o espectro é mais concentrado. A ITU-T na recomendação G.132 e G.151 determina que em sistemas telefónicos a faixa de frequência utilizada esteja entre os 300 Hz e os 3.4kHz.

Amostragem

Para a digitalização do sinal e realizada a amostragem do sinal filtrado usando a Modulação PAM (i.e. Pulse Amplitude Modulation) que converte o sinal analógico original num trem de pulsos com amplitude e frequência constantes. Este trem de pulsos move-se a uma frequência constate conhecida como frequência de amostragem.

O sinal de voz pode ser amostrado a milhões de ciclos por segundo ou a pequenos ciclos por segundo. O sinal analógico de voz é recriado usando o teorema de Nyquist[1], segundo o qual, a frequência necessária para recriar o sinal original de voz, ou seja a frequência de amostragem, tem de ser maior que duas vezes a mais alta frequência do sinal original de voz. A frequência de amostragem pode ser determinada pela expressão abaixo:

Onde:

Fa – É a frequência de amostragem.
BW – É a largura de banda do sinal original de voz.

Como a frequência mais alta do sinal são 3.4kHz então o sinal original pode ser reconstruído sem distorção a frequência de 8kHz.

Quantificação

A quantificação tem por objectivo atribuir valores discretos de amplitude ao sinal amostrado. Esta operação introduz distorção no sinal, que é geralmente conhecido como ruído de quantificação. O erro de quantificação, está associado ao intervalo de quantificação. O intervalo de quantificação q possui um determinado número de amostras e representa-as pelo centro do seu intervalo Xi. Se for retirada uma amostra do sinal X(t) no instante X(ti) cujo centro do intervalo de quantificação é definido por Xi. A figura abaixo ilustra isso:

Quantificação no processo de amostragem do sinal

Considere-se uma amostra do sinal X(t) tirada no instante ti a qual se encontra no intervalo Xi+q/2>X(ti)>Xi-q/2. Esta amostra irá ser quantificada pelo nível Xi. O erro de quantificação será definido por Eq = Xi – X. Onde X= X(ti).

Codificação

O processo de codificação, consiste em transmitir os níveis de quantificação usando-se códigos binários, a fim de aproveitar a imunidade ao ruído das transmissões digitais, conforme a figura a seguir:

Codificação no Processo de amostragem do sinal

O número de bits necessários para representar cada amostra é dado pela equação abaixo:

Expressao para determinar Numero de bits

Onde L é o numero dos níveis de quantificação. Como a cada amostra são atribuídos 8 bits e a frequência de amostragem é igual a 8kHz, então temos um débito de 64kbps (i.e. 8 bits x 8kHz=64kbps).

Fontes:

1 – Joao J. O. Pires [Sistemas e Redes de Telecomunicações, Departamento de Engenharia Electrotécnica e de Computadores
Instituto Superior Técnico]

2 – BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço, UCAN]

 


[1] Engenheiro. Contribuiu para a teoria da informação

A importância das redes Voz sobre IP

Com o aumento da necessidade de comunicação entre entidades comerciais e administrativas, o uso da Internet e das comunicações de voz como meio de inter-relacionamento assumiu uma importância nunca antes vista. Com a criação da WWW (i.e World Wide Web) a partir do fim dos anos 80, início dos anos 90 e o aumento do número de clientes da Internet, as entidades comerciais e administrativas notaram que não havia uma integração entre os dados e a voz.

Uma entidade tinha de ter uma rede de dados e uma rede de voz. Isto tinha consequências, como o aumento de custos e a dificuldade técnica de instalação, gerenciamento e manutenção. Por exemplo, uma universidade tinha de gastar recursos financeiros elevados, apenas para interligar os seus campus em diferentes localizações geográficas.

 

Em Angola entidades governativas a nível mesmo de municípios e comunas continuam a debater-se com problemas de custos de chamadas telefónicas não autorizadas e controladas, devido a dificuldade de se controlar, quem chama, quanto chama e quando chama.

O padrão de comunicação que permite reduzir custos de chamadas de voz e adiciona facilidades de gerenciamento e controlo chama-se VoIP (i.e. Voice over IP) ou Voz sobre IP. Este padrão veio tirar proveito da larga escalabilidade da Internet uma rede globalmente estabelecida, e dos seus modelos de comunicação, como o modelo OSI (i.e. Open Systems Interconnection) ou o modelo TCP/IP (i.e. Transport Control Protocol/Internet Protocol), para estabelecer ligações de voz a partir da Internet.

 

Talvez nos perguntemos porque não era possível antes fazer-se isso. Na verdade, sempre foi possível, dado que a maior parte dos protocolos estavam já criados ou em fase de criação. O único problema foi sempre o transporte. Os meios físicos de transporte de dados dos anos 70 não tinham o débito necessário para suportar grandes dimensões de dados, quanto mais de voz.
Com o passar dos anos e o advento de tecnologias e meios de transporte, como as fibras ópticas e a criação de padrões de Qualidade de Serviço, ou técnicas de engenharia e controlo de tráfego para controlar o alto débito binário da multiplexagem TDM[1] então o conceito e adopção de VoIP foi ganhando mais aceitação e mais investimentos, como temos verificado até hoje.

Fonte: BAIÃO, Nataniel [Implementação duma rede Voz sobre IP num ambiente Multi-Serviços: Usando ambiente de simulação por computador para projectar Qualidade de Serviço]


[1] A informação é transmitida em fatias de tempo