summaryrefslogtreecommitdiffstats
path: root/misc/analiza.txt
diff options
context:
space:
mode:
Diffstat (limited to 'misc/analiza.txt')
-rw-r--r--misc/analiza.txt7
1 files changed, 4 insertions, 3 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt
index c0cca4d..1eb07ce 100644
--- a/misc/analiza.txt
+++ b/misc/analiza.txt
@@ -3,7 +3,7 @@ cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host=
analizirati:
- kateri nestandardni ključi so v info slovarjih [izdelal @ s/nestandardni //]
- encodingi
-- končnice datotek
+- končnice datotek [izdelal + mime]
- kategoriziranje po imenih torrentov in datotek
- število datotek -- percentile
- velikost torrenta -- percentile
@@ -13,12 +13,13 @@ analizirati:
- kodeki (iz imena; x265, x264, ...)
- resolucije (iz imena, 4K, 4K60fps, 720p)
- top n source
-- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?)
+- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT -- lahko tudi samo po tipu reprezantativne datoteke)
- ip naslovi + geoip
- odjemalci: verzije, popularnost v državi
- porti odjemalcev -- distribucija
-- koliko % torrentov ima google -- sear.c
+- koliko % torrentov ima google -- sear.c (majhen sample, ne vseh)
- https://pypi.org/project/parse-torrent-title/
+- graf števila prenesenih torrentov v odvisnosti od ure
citirati:
- bep