Header \begin_inset Argument 1 status open \begin_layout Plain Layout \begin_inset ERT status collapsed \begin_layout Plain Layout \backslash leftmark \end_layout \end_inset \end_layout \end_inset \end_layout \begin_layout Left Footer \begin_inset Argument 1 status open \begin_layout Plain Layout \begin_inset ERT status collapsed \begin_layout Plain Layout \backslash thepage \end_layout \end_inset \end_layout \end_inset \end_layout \begin_layout Center Footer \end_layout \begin_layout Right Footer \begin_inset Argument 1 status open \begin_layout Plain Layout \end_layout \end_inset \begin_inset ERT status collapsed \begin_layout Plain Layout \backslash thepage \end_layout \end_inset \end_layout \begin_layout Chapter Razprava \end_layout \begin_layout Section Težave pri pridobivanju podatkov \end_layout \begin_layout Subsection Napad Sybil \end_layout \begin_layout Standard Napad Sybil je pogosto možen v DHT omrežjih, ki za identifikacijske številke vozlišč ne izvajajo asimetrične kriptografije — izrazito je prisoten pri Kademili oz. BitTorrent Mainline DHT. Napad učinkovito omrtviči vozlišča — onemogoči vzpostavljanje povezav in zapolni usmerjevalno tabelo tako, da so v njej večinoma napadalčeva vozlišča. Napadalec iz enega ali več IP naslovov izdela veliko število virtualnih vozlišč, katerih IDji so zelo blizu vozlišča žrtve napada. Tako bo žrtev vedno vstavila napadalčeva vozlišča v usmerjevalno tabelo, saj bo vedno lahko razpolovila koš. \end_layout \begin_layout Standard Usmerjevalna tabela žrtve ob uspešnem napadu izgleda takole: \end_layout \begin_layout Standard \begin_inset ERT status open \begin_layout Plain Layout \backslash lstinputlisting[basicstyle= \backslash tiny]{/root/projects/travnik/misc/sybil.txt} \end_layout \end_inset \end_layout \begin_layout Subsubsection Preventivni omilitveni ukrepi \end_layout \begin_layout Itemize Vozlišče v usmerjevalno tabelo sprejme samo eno vozlišče iz enega IP naslova. Težava nastane pri IPv6, ko je dolžina predpone omrežja lahko zelo različna. Napadalci imajo lahko na voljo velik spekter naslovov, celo večji od /48, legitimni uporabniki pa imajo velikokrat naslovne prostore velikosti /128 (samo en naslov). \end_layout \begin_layout Itemize Uporaba fiksnih prefiksov IDjev (BEP 0042) (citiraj), kjer morajo vozlišča uporabljati ID, ki se začne z IP naslovom, transformiranim skozi CRC32c funkcijo. Težava nastane, ko imajo napadalci spet dovolj velik naslovni prostor, da lahko pokrijejo vse predpone IDja. Poleg tega je to zgolj razširitev osnovnega DHT protokola, na katero se odjemalci ne morejo zanašati. Nepravilen ID je sicer lahko napadalec, lahko pa je tudi vozlišče, ki razširitv e ni implementiral. \end_layout \begin_layout Itemize Vsakemu vozlišču lahko pred vstavljanjem v usmerjevalno tabelo pošljemo ping paket, ki vsebuje drugačen ID, kot ga odjemalec sicer uporablja. Če v odgovoru na ping ID vozlišča ni enak, kot smo ga videli prej, pomeni, da je vozlišče zagotovo napadalec. Težava nastane, ko lahko sogovornik nas smatra kot napadalca, saj smo mu poslali pakete iz dveh različnih node IDjev (čeprav v teoriji ne smemo zaupati izvornemu naslovu prejetih UDP paketov). \end_layout \begin_layout Subsubsection Ublažitev posledic napada \end_layout \begin_layout Standard travnik ima poleg omejitve največ enega vozlišča z enim IP naslovom v usmerjeval ni tabeli tudi protiukrep, ki prepreči zavrnitev storitve kot posledico napada Sybil. Protiukrep deluje tako, da v primeru, ko zazna, da ima shranjenih več kot 64 košev, izbriše skoraj celotno usmerjevalno tabelo in se še enkrat sinhronizi ra z omrežjem z novim IDjem, v upanju, da napadalec ne bo napadel še enkrat. \end_layout \begin_layout Subsection Slaba zmogljivost mrežne opreme \end_layout \begin_layout Standard Ker se ob normalnem delovanju travnika prenese do 2000 paketov z različnimi IP naslovi na sekundo, slaba omrežna oprema kljub majhni porabljeni pasovni širini (okoli 4 megabite na sekundo) začne delovati slabo. Ključen primer je bil domači optični modem, ki med delovanjem travnika burno izgublja pakete do te mere, da prihaja do izpadov razreševanja internetni h imen (DNS). Problem sem omilil (na 2000 paketov/s) tako, da nov najden infohash dodam med željene torrente največ enkrat na dve sekundi in omejim čas življenja torrenta (koliko časa za torrent aktivno iščem soležnike, preden ga izbrišem) na 256 sekund. Seveda to zaradi velike količine torrentov, za katere nikoli ne dobim metapodat kov, precej zmanjša število prejetih torrentov. \end_layout \begin_layout Section Uporabna vrednost korpusa prenesenih podatkov \end_layout \begin_layout Standard Podatki predstavljajo vzorec populacije torrentov, ki se pretakajo po internetu. Vsak prenesen torrent je poleg metapodatkov o datotekah označen še s časom prejema, programsko opremo in različico odjemalca, ki je torrent poslal, ter IP naslovom pošiljatelja. Glede na te informacije je možno analizirati stanje BitTorrent omrežja skozi čas, ugotoviti, za kakšne namene se uporablja (kakšne vsebine se pretakajo z njim), kateri programi/države prevladujejo, kakšni podatkovni tipi datotek so najbolj pogosti itd. \end_layout \begin_layout Section Etičnost in legitimnost rudarjenja podatkov \end_layout \begin_layout Standard Čeprav gre za izrazito osebne podatke, se morajo uporabniki BitTorrent omrežja zavedati, da so njihovi prenosi \shape italic a priori \shape default javni, tudi če jih nihče aktivno ne prenaša. Nekateri BitTorrent odjemalci uporabnike ob prvem zagonu o tem celo obvestijo, med delovanjem pa celo prikazujejo IP naslove soležnikov, na katere se povezujejo. Uporabniki se zato zavedajo, da je njihova identiteta drugim članom roja znana. Pogosto pa se ne zavedajo, da se obstoječe roje da odkriti in se jim pridružiti. (vstavi sliko) \end_layout \begin_layout Section Invazivnost v omrežje \end_layout \begin_layout Standard Implementacija za to raziskavo je delovala neinvazivno, saj je implementirana tako, kot bi bil implementiran navaden torrent odjemalec, le da zahteve pošilja hitreje. Ne poslužuje se bolj invazivnih taktik, ki posegajo v omrežje, kot je npr. napad Sybil (citiraj), in dosledno shranjuje in daje drugim na razpolago informacije o soležnikih. \end_layout \begin_layout Standard Program bi bil lahko manj invaziven, če bi namesto \family typewriter find_nodes \family default pošiljal \family typewriter ping \family default zahteve, ko bi bilo to ustrezno. \family typewriter find_nodes \family default se vseeno uporablja, da se z enim paketom pridobi čim več informacij o vozliščih. \end_layout \begin_layout Section Vzorčenje ključev \end_layout \begin_layout Standard Vzorčenje ključev, opisano v protokolu BEP-xxxx (citiraj), ni bilo uporabljeno, ker ga ne podpirajo vse implementacije BitTorrent DHT protokola. 