VoIP grunder


Voice over IP (VoIP) innebär att röst inte längre skickas som analoga signaler i ett traditionellt telefonnät, utan istället omvandlas till IP-paket som transporteras över ett datanätverk.

För att detta ska fungera krävs flera samverkande funktioner. Det är viktigt att förstå att VoIP inte är en enskild teknik, utan en kombination av adressering, signalering och mediaöverföring.

Tre grundläggande funktioner i VoIP

Först behöver vi förstå att ett VoIP-system alltid består av tre centrala delar:

  1. hur enheten får sin nätverksinformation
  2. hur ett samtal sätts upp och styrs
  3. hur själva rösten transporteras

Den första delen handlar om att telefonen blir en del av nätverket. När en IP-telefon startar behöver den få en IP-adress via DHCP. Samtidigt får den information om var den kan hämta sin konfiguration, vilket vanligtvis sker via TFTP och DHCP option 150. När detta är klart kan telefonen registrera sig hos en call-control, till exempel Call Manager Express (CME).

Den andra delen är signalering. Det är här samtalet “skapas”. När en användare slår ett nummer skickar telefonen en signal till call-control-systemet, oftast med hjälp av SIP. Denna signal innehåller information om vem som ringer och vem som ska nås. Systemet avgör sedan hur samtalet ska kopplas.

SIP (Session Initiation Protocol) är det vanligaste signaleringsprotokollet inom VoIP.
Det används för att starta, hantera och avsluta telefonsamtal, men transporterar inte själva rösten.

Den tredje delen är själva röstöverföringen. När samtalet är etablerat börjar telefonerna skicka ljud till varandra med hjälp av RTP. Det är alltså RTP som transporterar rösten, medan SIP endast hanterar uppkopplingen av samtalet.

Så går ett VoIP-samtal till

För att få en tydlig helhetsbild kan processen beskrivas steg för steg.

När telefonen startar ansluts den till nätverket och begär en IP-adress via DHCP. Samtidigt får den information om TFTP-servern, vilket gör att den kan hämta sin konfigurationsfil. I denna fil finns bland annat information om vilket telefonnummer den ska använda och vilken call-control den ska registrera sig mot.

När användaren sedan ringer ett nummer skickar telefonen en signal (SIP) till call-control-systemet. Systemet analyserar numret och avgör var mottagaren finns.

  • Om mottagaren är lokal kopplas samtalet direkt inom samma router.
  • Om mottagaren finns på en annan plats används dial-peers för att skicka samtalet vidare.

När samtalet är etablerat startar en RTP-ström mellan telefonerna. Det är nu själva ljudet börjar skickas i realtid som UDP-paket. När samtalet avslutas skickas en ny signal som stänger ner sessionen och stoppar RTP-strömmen.

Viktiga protokoll och deras roller

För att förstå VoIP på djupet behöver man kunna skilja på vad varje protokoll faktiskt gör.

  • DHCP används för att tilldela IP-adresser och ge telefonen grundläggande nätverksinformation
  • TFTP används för att leverera telefonens konfigurationsfiler
  • SIP används för att starta, hantera och avsluta samtal
  • RTP används för att transportera själva rösten
  • CDP eller LLDP används för att tala om för telefonen vilket Voice VLAN den ska använda

En vanlig missuppfattning är att SIP transporterar ljud, men det gör det inte. SIP är endast ett signaleringsprotokoll, medan RTP står för själva mediaöverföringen.

Codec – hur rösten blir data

Innan rösten kan skickas över nätverket måste den omvandlas från analog till digital form och därefter komprimeras. Detta görs med hjälp av en codec.

Vanliga exempel är:

  • G.711, som ger hög kvalitet men använder mer bandbredd
  • G.729, som komprimerar mer och använder mindre bandbredd

Valet av codec påverkar både nätverkets belastning och upplevd samtalskvalitet.

Varför QoS är avgörande

Till skillnad från vanlig datatrafik är rösttrafik mycket känslig för störningar. För att samtal ska upplevas som naturliga måste paketen levereras snabbt och jämnt.

Tre begrepp är centrala:

  • latency (fördröjning)
  • jitter (variation i fördröjning)
  • packet loss (förlorade paket)

Om dessa värden blir för höga försämras samtalskvaliteten direkt. Därför används QoS för att prioritera rösttrafik framför mindre tidskritisk trafik, till exempel filöverföringar.

Skillnaden mellan IP-routing och call routing

En viktig insikt i VoIP är att det finns två parallella “routing-världar” i nätverket.

IP-routing, till exempel med OSPF, bestämmer hur paket färdas genom nätverket rent tekniskt. Den ser till att det finns en fungerande väg mellan två enheter.

Call routing, däremot, bestämmer hur själva telefonsamtalet ska kopplas. Detta görs med dial-peers, som matchar telefonnummer mot en destination.

Det innebär att ett nätverk kan ha full IP-connectivity, men ändå sakna fungerande VoIP om dial-peers inte är korrekt konfigurerade.

Koppling till Voice VLAN

Med denna förståelse blir det tydligt hur allt inom VoIP hänger ihop.

Voice VLAN används för att separera röst- och datatrafik och möjliggör QoS. DHCP med option 150 gör att telefonerna hittar rätt server. CME fungerar som call-control och hanterar samtalen. RTP transporterar rösten och SIP hanterar signaleringen.

OSPF ser till att IP-paketen kan nå rätt destination, medan dial-peers avgör hur samtalen kopplas mellan olika platser.

Sammanfattning

VoIP fungerar genom att flera tekniker samverkar:

  • telefonen får nätverksinformation via DHCP
  • den hämtar konfiguration via TFTP
  • den registrerar sig i CME
  • samtal etableras via SIP
  • rösten transporteras via RTP
  • QoS säkerställer kvalitet
  • dial-peers styr samtal mellan nätverk

När man ser dessa delar som en helhet blir VoIP betydligt enklare att förstå, konfigurera och felsöka.