Mètriques de Tor

We actually don't count users, but we count requests to the directories that clients make periodically to update their list of relays and estimate number of users indirectly from there.

No, però podem veure quina fracció de directoris els ha informat, i després podem extrapolar el nombre total de la xarxa.

We put in the assumption that the average client makes 10 such requests per day. A tor client that is connected 24/7 makes about 15 requests per day, but not all clients are connected 24/7, so we picked the number 10 for the average client. We simply divide directory requests by 10 and consider the result as the number of users. Another way of looking at it, is that we assume that each request represents a client that stays online for one tenth of a day, so 2 hours and 24 minutes.

Nombre mitjà d'usuaris concurrents, estimat a partir de les dades recollides durant un dia. No podem dir quants usuaris diferents hi ha.

No, the relays that report these statistics aggregate requests by country of origin and over a period of 24 hours. The statistics we would need to gather for the number of users per hour would be too detailed and might put users at risk.

Then we count those users as one. We really count clients, but it's more intuitive for most people to think of users, that's why we say users and not clients.

Els directoris resolen les adreces IP en codis de país i informen d'aquests números en forma agregada. Aquesta és una de les raons per les quals tor s'envia amb una base de dades GeoIP.

Encara són molt pocs els ponts que informen de dades sobre transports o versions IP i, per defecte, considerem les sol·licituds per utilitzar el protocol OR i IPv4 per defecte. Quan més ponts informin d'aquestes dades, els números seran més precisos.

Els repetidors i els ponts informen d'algunes de les dades en intervals de 24 hores que poden acabar a qualsevol hora del dia.
I un cop finalitzat aquest interval, els repetidors i els ponts poden trigar 18 hores més a informar de les dades.
We cut off the last two days from the graphs, because we want to avoid that the last data point in a graph indicates a recent trend change which is in fact just an artifact of the algorithm.

El motiu és que publiquem els números d'usuari quan estem prou segurs que ja no canviaran de manera significativa. Però sempre és possible que un directori informi de dades unes hores després que estiguéssim prou segurs, però que canviés lleugerament el gràfic.

Tenim arxius de descriptors d'abans d'aquell moment, però aquests descriptors no contenien totes les dades que utilitzem per estimar el nombre d'usuaris. Si us plau, busqueu el fitxer tarball següent per obtenir més detalls:

Tarball

For direct users, we include all directories which we didn't do in the old approach. We also use histories that only contain bytes written to answer directory requests, which is more precise than using general byte histories.

Oh, aquesta és una història completament diferent. Vam escriure un informe tècnic de 13 pàgines explicant els motius per retirar l'antic enfocament.
Resumint, en l'antic enfocament mesuràvem allò equivocat, i ara mesurem el correcte.

Executem un sistema de detecció de censura basat en anomalies que analitza el nombre d'usuaris estimat durant una sèrie de dies i prediu el nombre d'usuaris en els propers dies. Si el nombre real és més alt o inferior, això podria indicar un possible esdeveniment de censura o d'alliberament de la censura. Per obtenir més detalls, consulteu el nostre informe tècnic.