last updated 2008.04.02

RTT e LOSS su linea ADSL NGI - Pisa

(Most of this page is in Italian. Executive summary in english: here I am reporting the status of my DSL line with NGI, one of the few Italian providers offering guaranteed bandwidth on its DSL lines.

Occasional 'Service DOWN' faults are generally handled reasonably quickly, but other problem affecting quality, bandwidth or high loss take a long time to be handled or resolved. Most of the problem is that the DSL/ATM infrastructure is rented from Telecomitalia and not run directly from the provider, so there is a continuous bounce between the two, until eventually something gets done.

Apart from the trivia on the Telecomitalia technical support, the graphs below contain RTT and loss data over a number of months, and also a picture of the carrier state on my particular DSL line, which is affected by an annoying noise that regularly appears at 5.45 and disappears at midnight. See the full graphs.

Di seguito i grafici di round trip time e loss rate di una linea ADSL F5 di NGI situata a Pisa (centrale telecom di Pisa Centro), e i dati (su intervalli piu' brevi) di SNR riportati dal modem sulle varie portanti.

I dati sono misurati ogni due minuti con ping -i 0.1 -c 300 maya.ngi.it in modo da ottenere un campione significativo. Il traffico generato corrisponde a 10 pacchetti/640 bytes al secondo, e normalmente non esiste altro traffico sulla linea. I grafici rappresentano il round trip time minimo e medio, e (curva in basso) la loss rate. La linea è usata prevalentemente per traffico interattivo dell'ordine di pochi kbit/s.

La portante era originariamente 1.5Mbit, elevata intorno a 2.5Mbit a giugno 2007, 5 Mbit a inizio gennaio 2008, e 8 Mbit da fine gennaio 2008.

Al di là di occasionali situazioni di servizio down (forse 5-6 l'anno), risolte normalmente nel giro di poche ore dalla segnalazione, mediamente il funzionamento della linea è soddisfacente in termini di qualità e banda. Ci sono però state tranne due fasi temporali, purtroppo piuttosto lunghe (4 e 8 settimane) durante le quali si sono verificati forti malfunzionamenti che tenteremo di descrivere con l'ausilio dei grafici:

E' interessante osservare i grafici perchè rappresentano differenti tipi di guasto.


novembre 2008:


ottobre 2008:


settembre 2008:


agosto 2008:


luglio 2008:


giugno 2008:


maggio 2008:


aprile 2008:


marzo 2008: rumore sulla linea fino al 20, congestione ATM fino al 14
I grafici di gennaio, febbraio e marzo mostrano due tipi di guasto. Uno, più importante, riguarda problemi elettrici sulla linea, comparsi dopo la variazione di profilo al cosiddetto "7 Mega" (portante intorno a 8100 kbit/s); un secondo, sovrapposto, relativo a congestione su link di raccolta.

febbraio 2008: rumore sulla linea per tutto il mese, congestione ATM a fine mese


gennaio 2008: congestione ATM dal 21 in poi

Problemi elettrici sulla linea:

In seguito al cambio di profilo a 7 Mega, il modem ha cominciato a riportare un margine di rumore di 3..5dB, e in corrispondenza a questo regime le disconnessioni sono frequentissime nel corso della giornata, e insieme a queste si verificano numerose loss non correlate al traffico. Un cambio di modem non modifica sostanzialmente la situazione, ma permette di verificare lo stato delle singole portanti, in particolare il rapporto segnale rumore (SNR), che indica (vedi zona in verde e rosso) un forte disturbo intorno alla 152. Vedi grafici completi.
Operational Channel report : near end (Downstream) 
-------------------------------------------------- 
1) SNR (dB)
Carrier  38 : 28.1 29.0 
Carrier  40 : 30.8 31.6 34.4 35.1 38.0 37.8 40.5 41.1 44.3 44.4 
Carrier  50 : 47.3 46.9 47.4 46.8 47.1 47.4 47.4 47.3 46.8 46.8 
Carrier  60 : 46.8 47.0 50.0 50.2 48.5 49.2 47.0 46.8 46.6 46.4 
Carrier  70 : 46.8 47.7 46.9 47.1 46.9 46.8 46.7 47.6 46.6 47.0 
Carrier  80 : 47.1 47.4 47.0 46.9 46.6 47.3 46.4 47.3 47.5 47.3 
Carrier  90 : 47.4 47.4 44.2 43.9 44.1 43.8 44.6 44.7 44.6 44.4 
Carrier 100 : 44.6 44.4 44.1 44.1 44.1 44.2 43.9 44.9 44.8 44.6 
Carrier 110 : 44.3 44.2 44.2 44.2 44.1 44.1 44.1 43.9 44.0 43.9 
Carrier 120 : 43.9 44.6 43.4 43.4 44.3 41.3 44.0 40.9 40.8 40.6 
Carrier 130 : 41.4 41.2 41.1 40.5 41.3 41.0 41.4 41.4 41.2 40.9 
Carrier 140 : 40.3 41.3 37.7 38.1 38.3 38.4 35.3 34.7 31.7 31.2
Carrier 150 : 23.7 20.2  8.3 13.0 24.1 24.1 28.7 30.9 31.6 35.0
Carrier 160 : 35.2 35.1 34.9 38.2 38.0 38.3 38.4 37.7 37.8 37.8 
Carrier 170 : 37.6 37.8 37.6 37.6 38.4 38.3 38.1 38.1 37.9 38.0 
Carrier 180 : 38.1 38.1 38.3 38.4 38.4 37.4 37.6 37.4 35.0 38.2 
Carrier 190 : 38.3 37.8 37.8 37.6 37.5 38.3 38.1 34.9 34.8 34.3 
Carrier 200 : 35.3 35.4 35.3 34.6 34.3 35.4 34.6 35.5 34.4 35.1 
Carrier 210 : 34.6 35.4 34.6 34.4 34.3 35.1 35.4 34.6 34.3 34.2 
Carrier 220 : 34.8 34.4 31.3 31.0 31.0 34.0 30.9 30.9 31.1 31.1 
Carrier 230 : 31.0 30.9 31.0 30.8 30.5 31.3 31.1 30.7 31.2 30.7 
Carrier 240 : 31.0 30.3 27.4 27.9 22.7 22.9 10.9 18.2 19.6 17.9 
Carrier 250 : 15.8 13.1 10.5 8.8 0.0 0.0 
Ulteriori misure mostrano che la fonte di disturbo (tuttora non determinata) si accende e si spegne periodicamente nella giornata, tipicamente attiva tra le 5.45 e mezzanotte. Successivamente ho anche verificato che il disturbo nella zona della portante 152 é presente anche su un'altra linea attestata sulla stessa centrale e dalla parte opposta della città. Questo porta a pensare che la fonte del disturbo sia in centrale e non lungo il percorso del cavo.

I grafici sotto mostrano l'andamento del rapporto segnale rumore (SNR) sulle portanti ogni due minuti (click sull'immagine per la versione a piena risoluzione). Ogni grafico rappresenta tre giorni, in alto le portanti basse, in basso le portanti più alte; il colore chiaro rappresenta SNR alto, il colore scuro indica SNR basso. Le linee nere verticali corrispondono a istanti in cui il modem ha perso il sincronismo:


Scoperta l'origine del problema, invio segnalazioni dettagliate al provider, che le inoltra a Telecomitalia, che a sua volta mi chiama o manda tecnici (6-7 interventi in totale), a volte armati di buona volontà ma senza modem o strumenti per analizzare la linea. Ogni volta la trafila è la seguente: 1) il tecnico Telecom in mia presenza riconosce l'esistenza del problema e la mancata risoluzione;
2) nel giro di poche ore Telecom comunica al provider che secondo loro il problema è stato risolto;
3) NGI mi gira la comunicazione dicendo che invece a loro il problema risulta ancora presente e chiedendo mio feedback;
4) confermo il persistere del problema, fornisco i dettagli dell'intervento, e chiedo di tornare al punto 1.

In questa fase, su mia richiesta viene sostituito una volta il doppino "secondario" (dall'armadio in strada a quello nel mio condominio), ma senza effetto sul disturbo che permane sostanzialmente inalterato. Successivamente, riesco ad ottenere una verifica a livello dell'armadio Telecom in strada, che mostra come il disturbo sia presente già a quel livello. In due interventi successivi sono provati alcune volte i doppini "primari", ovvero dall'armadio telecom in strada alla centrale. Anche in questi casi il disturbo ha un lieve miglioramento (vedi figura sotto) senza però sparire del tutto:

Fino all'ultimo intervento e nonostante numerose richieste non mi riesce di ottenere le cose più ovvie, ovvero: la misura del segnale direttamente sulla porta in centrale (per verificare se il disturbo non provenga dalla fonte), e soprattutto, visto che si tratta di un problema legato anche al basso SNR, una modifica del "profilo" della porta in modo da utilizzare una banda minore rispetto a quella massima (8Mbit) disponibile.

Solo in occasione dell'ultimo intervento viene finalmente effettuato un cambio profilo, che usa la banda in modo meno aggressivo, aumentando quindi il rapporto segnale rumore e finalmente rende stabile il comportamento della linea:

Dopo cambio profilo                                Prima del cambio profilo
Operational data report : near end (Downstream) 
----------------------------------------------- 
Attainable line rate      :  7860 kbit/sec        7608 kbit/sec
Attainable Atm rate       :  7360 kbit/sec        7136 kbit/sec
Used line rate            :  5292 kbit/sec        7608 kbit/sec
Fast used Atm rate        :  4832 kbit/sec        7136 kbit/sec
Interleaved used Atm rate :     0 kbits/sec
Rel. capacity occupation  :    67                  100
Noise Margin              :    14 dB                5 dB
Line attenuation          :    33 dB
Output Power              :    19 dBm
In precedenza, salvo sporadici periodi di down, la linea è stata fondamentalmente stabile (zero loss, ritardo minimo costante) per diversi mesi:

dicembre 2007: tutto ok


novembre 2007: lieve congestione a livello del link, ma configurazione corretta dei meccanismi di QoS che evitano loss a chi non è responsabile del traffico


ottobre 2007: tutto ok


settembre 2007: congestione ATM con errata configurazione della QoS per cui anche chi non produce traffico in eccesso si trova ad osservare loss periodiche durante la giornata.


agosto 2007:praticamente sempre ok


luglio 2007: lievi congestioni dal 20 in poi, praticamente non percepibile


giugno 2007: grave congestione a livello ATM fino al 14, linea praticamente inutilizzabile nella maggioranza della giornata