Tor-გაზომვები

ჩვენ სინამდვილეში არ ვითვლით მომხმარებლებს, არამედ ვითვლით მოთხოვნებს ცნობარების მიმართ, რომლითაც კლიენტები დროდადრო აახლებენ თავიანთი გადამცემების სიას, ეს გვაძლევს მომხმარებელთა მიახლოებითი რაოდენობის არაპირდაპირ მონაცემებს.

არა, მაგრამ ჩვენ შეგვიძლია ვნახოთ ნაწილი ცნობარებისა, რომლებიც გადმოსცემს ამ მონაცემებს და შემდეგ ვივარაუდოთ საერთო რაოდენობა ქსელში.

ჩვენ ვაკეთებთ დაშვებას, რომ კლიენტი საშუალოდ 10 ასეთ მოთხოვნას აგზავნის დღეში. Tor-კლიენტი რომელიც ჩართულია 24/7 დროით, დაახლოებით 15 მოთხოვნას აგზავნის დღეში, მაგრამ ყველა კლიენტი არაა მიერთებული 24/7, ამიტომ ჩვენ ვირჩევთ საშუალოდ 10 მოთხოვნას თითო კლიენტისთვის. ჩვენ უბრალოდ ვყოფთ ცნობარის მოთხოვნების რაოდენობას 10-ზე და ვიღებთ მომხმარებელთა რაოდენობას. შეიძლება სხვანაირადაც შევხედოთ, რომ დავუშვათ თითოეული მოთხოვნა წარმოადგენს კლიენტს, რომელიც ატარებს ინტერნეტში, დღის მეათედ ნაწილს, 2 საათსა და 24 წუთს.

საშუალო რაოდენობა საერთო მომხმარებლების, გამოთვლილი დღიურად აგროვებული მონაცემებიდან. ჩვენ ვერ ვიტყვით, უნიკალური რამდენია მათ შორის.

არა, გადამცემები აგზავნის მოთხოვნების დაგროვებულ სტატისტიკურ მონაცემებს, წარმომავალი ქვეყნების მიხედვით, 24 საათიანი შუალედებით. სტატისტიკური მონაცემები, რომლებიც საჭიროა საათში მომხმარებლების რაოდენობის დასადგენად, გაცილებით მეტ წვრილმან ინფორმაციას საჭიროებს, რაც მომხმარებლებისთვის საფრთხეს შეიძლება წარმოადგენდეს.

მაშინ ეს მომხმარებლები მიიჩნევა ერთ მომხმარებლად. ჩვენ სინამდვილეში კლიენტებს ვითვლით, მაგრამ ხალხის უმეტესობა მომხმარებლებს მოიაზრებს ხოლმე, ამიტომაც ჩვენც მომხმარებლებს ვამბობთ და არა კლიენტებს.

არა, ვინაიდან ეს მომხმარებელი აახლებს გადამცემების სიას იმდენჯერვე დღეში, რამდენჯერაც ის მომხმარებელი, რომელიც არ ცვლის IP-მისამართს.

ეს ცნობარები აქცევს IP-მისამართებს ქვეყნის კოდებად და გადმოსცემს ამ ციფრებს ერთიანი სახით. ესაა ერთ-ერთი მიზეზი, რატომაც არის Tor აღჭურვილი GeoIP მონაცემთა ბაზით.

ჯერჯერობით, ძალიან ცოტა ხიდი გადმოსცემს მონაცემს გადამყვანზე ან IP-ვერსიაზე, ამიტომ თავისთავად გადაწყდა, რომ მოთხოვნებისთვის გამოყენებული იყოს ნაგულისხმევი OR-ოქმი და IPv4. რაც უფრო მეტი ხიდი გადმოსცემს ამ მონაცემებს, რაოდენობა მით უფრო ზუსტი იქნება.

გადამცემები და ხიდები მონაცემთა ნაწილს აგზავნის 24-საათიანი შუალედებით, რომლებიც დღის ნებისმიერი მონაკვეთში შეიძლება დასრულდეს.
ამ შუალედის გასვლის შემდეგ კი გადამცემებსა და ხიდებს დამატებით 18 საათი შეიძლება დასჭირდეს მონაცემთა წარსადგენად.
ჩვენ ვაჭრით ბოლო ორი დღის მონაცემებს გრაფიკიდან, ვინაიდან გვსურს ავირიდოთ ბოლო წერტილის გადახრით გამოწვეული ცვლილება, რაც შეიძლება მხოლოდ შემთხვევით წანაცვლებას წარმოადგენდეს.

მიზეზი ისაა, რომ მომხმარებელთა რიცხვებს მხოლოდ მას შემდეგ ვაქვეყნებთ, რაც საკმარისად დავრწმუნდებით რომ მნიშვნელოვნად აღარ შეიცვლება. მიუხედავად ამისა, ყოველთვისაა შესაძლებელი, რომ ცნობარმა გადმოსცეს მონაცემი რამდენიმე საათის დაგვიანებით, მას შემდეგ, რაც დავრწმუნდებით უცვლელობაში, ეს კი ცოტათი მაინც ცვლის გრაფიკს.

ჩვენ გვაქვს აღწერილობის არქივები მაგ დრომდე, თუმცა არ შეიცავს ყველა იმ მონაცემს, რომელსაც ვიყენებთ მომხმარებელთა მიახლოებითი რაოდენობის გამოსათვლელად. გთხოვთ, იხილოთ ქვემოთ მოცემული Tarball, დაწვრილებითი მონაცემებისთვის:

Tarball

პირდაპირი მომხმარებლებისთვის, ჩვენ ვიყენებთ ყველა ცნობარს, განსხვავებით ძველი მიდგომისგან. ჩვენ აგრეთვე ვიყენებთ ადრინდელ მონაცემებსაც, რომლებიც შეიცავს ბაიტებს მხოლოდ ცნობარის მოთხოვნების საპასუხოდ, ეს კი მეტ სიზუსტეს იძლევა, ვიდრე ბაიტების ზოგადი ადრინდელი მონაცემები.

ოჰ, ეს სულ სხვა ამბავია. ჩვენ დავწერეთ 13-გვერდიანი ტექნიკური მოხსენება სადაც ახსნილია მიზეზები, ძველ მიდგომაზე უარის თქმის.
მოკლედ: ძველი მიდგომით ვზომავდით რაღაც არასწორ მონაცემებს, ახლა კი სწორ მონაცემებს ვზომავთ.

ჩვენ გაშვებული გვაქვს არსებულიდან გადახრის მიხედვით ცენზურის ამოცნობის სისტემა, რომელიც თვალს ადევნებს მომხმარებელთა მიახლოებით რაოდენობას დღეების გარკვეულ მიმდევრობაში და წინასწარ განჭვრეტს რაოდენობას მომდევნო დღეებისთვის. თუ მიმდინარე რაოდენობა გაზრდილი ან შემცირებული იქნება, ეს მიანიშნებს შესაძლო ცენზურაზე ან მის მოხსნაზე. დაწვრილებით, იხილეთ ჩვენი ტექნიკური მოხსენება.