Mètriques de Tor

De fet, no comptem els usuaris, però comptem les sol·licituds als directoris que els clients fan periòdicament per actualitzar la seva llista de retransmissions i estimar indirectament el nombre d'usuaris a partir d'aquí.

No, però podem veure quina fracció de directoris els ha informat, i després podem extrapolar el nombre total de la xarxa.

Suposem que el client mitjà fa 10 sol·licituds d'aquest tipus al dia. Un client de tor que està connectat les 24 hores del dia, els 7 dies de la setmana, fa unes 15 sol·licituds al dia, però no tots els clients estan connectats les 24 hores del dia, els 7 dies de la setmana, de manera que vam triar el número 10 per al client mitjà. Simplement dividim les sol·licituds de directoris per 10 i considerem el resultat com el nombre d'usuaris. Una altra manera de veure-ho és que suposem que cada sol·licitud representa un client que es manté en línia una dècima part del dia, és a dir, 2 hores i 24 minuts.

Nombre mitjà d'usuaris concurrents, estimat a partir de les dades recollides durant un dia. No podem dir quants usuaris diferents hi ha.

No, els repetidors que informen d'aquestes estadístiques agrupen les sol·licituds per país d'origen i en un període de 24 hores. Les estadístiques que hauríem de reunir sobre el nombre d'usuaris per hora serien massa detallades i podrien posar en perill els usuaris.

Aleshores comptem aquests usuaris com un. Realment comptem clients, però és més intuïtiu per a la majoria de la gent pensar en usuaris, per això diem usuaris i no clients.

Els directoris resolen les adreces IP en codis de país i informen d'aquests números en forma agregada. Aquesta és una de les raons per les quals tor s'envia amb una base de dades GeoIP.

Encara són molt pocs els ponts que informen de dades sobre transports o versions IP i, per defecte, considerem les sol·licituds per utilitzar el protocol OR i IPv4 per defecte. Quan més ponts informin d'aquestes dades, els números seran més precisos.

Els repetidors i els ponts informen d'algunes de les dades en intervals de 24 hores que poden acabar a qualsevol hora del dia.
I un cop finalitzat aquest interval, els repetidors i els ponts poden trigar 18 hores més a informar de les dades.
Hem tallat els dos últims dies dels gràfics, perquè volem evitar que l'últim punt de dades d'un gràfic indiqui un canvi de tendència recent que, de fet, és només un artefacte de l'algorisme.

El motiu és que publiquem els números d'usuari quan estem prou segurs que ja no canviaran de manera significativa. Però sempre és possible que un directori informi de dades unes hores després que estiguéssim prou segurs, però que canviés lleugerament el gràfic.

Tenim arxius de descriptors d'abans d'aquell moment, però aquests descriptors no contenien totes les dades que utilitzem per estimar el nombre d'usuaris. Si us plau, busqueu el fitxer tarball següent per obtenir més detalls:

Tarball

Per als usuaris directes, incloem tots els directoris que no vam fer a l'antic enfocament. També fem servir historials que només contenen bytes escrits per respondre a les sol·licituds de directoris, cosa que és més precisa que utilitzar historials generals de bytes.

Oh, aquesta és una història completament diferent. Vam escriure un informe tècnic de 13 pàgines explicant els motius per retirar l'antic enfocament.
Resumint, en l'antic enfocament mesuràvem allò equivocat, i ara mesurem el correcte.

Executem un sistema de detecció de censura basat en anomalies que analitza el nombre d'usuaris estimat durant una sèrie de dies i prediu el nombre d'usuaris en els propers dies. Si el nombre real és més alt o inferior, això podria indicar un possible esdeveniment de censura o d'alliberament de la censura. Per obtenir més detalls, consulteu el nostre informe tècnic.