summaryrefslogtreecommitdiffstats
path: root/misc
diff options
context:
space:
mode:
authorAnton Luka Šijanec <anton@sijanec.eu>2023-02-20 21:14:31 +0100
committerAnton Luka Šijanec <anton@sijanec.eu>2023-02-20 21:14:31 +0100
commit438f55be32ddb139db92fc3d1059ce1d3bc6accc (patch)
tree483300b59c0ba7ebd48370b94c4c111812e70b26 /misc
parentanaliza: filetypes (diff)
downloadtravnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar.gz
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar.bz2
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar.lz
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar.xz
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.tar.zst
travnik-438f55be32ddb139db92fc3d1059ce1d3bc6accc.zip
Diffstat (limited to 'misc')
-rw-r--r--misc/analiza.txt7
1 files changed, 4 insertions, 3 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt
index c0cca4d..1eb07ce 100644
--- a/misc/analiza.txt
+++ b/misc/analiza.txt
@@ -3,7 +3,7 @@ cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host=
analizirati:
- kateri nestandardni ključi so v info slovarjih [izdelal @ s/nestandardni //]
- encodingi
-- končnice datotek
+- končnice datotek [izdelal + mime]
- kategoriziranje po imenih torrentov in datotek
- število datotek -- percentile
- velikost torrenta -- percentile
@@ -13,12 +13,13 @@ analizirati:
- kodeki (iz imena; x265, x264, ...)
- resolucije (iz imena, 4K, 4K60fps, 720p)
- top n source
-- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?)
+- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT -- lahko tudi samo po tipu reprezantativne datoteke)
- ip naslovi + geoip
- odjemalci: verzije, popularnost v državi
- porti odjemalcev -- distribucija
-- koliko % torrentov ima google -- sear.c
+- koliko % torrentov ima google -- sear.c (majhen sample, ne vseh)
- https://pypi.org/project/parse-torrent-title/
+- graf števila prenesenih torrentov v odvisnosti od ure
citirati:
- bep