summaryrefslogtreecommitdiff
path: root/rapport.md
diff options
context:
space:
mode:
authorPacien TRAN-GIRARD2014-10-24 01:45:28 +0200
committerPacien TRAN-GIRARD2014-10-24 01:45:28 +0200
commit5e4f38688e4c14846b8264970a79c482c1ca7012 (patch)
tree6d150aa8f26eed939aabc9de1db3239a46cb7e05 /rapport.md
downloadwikistats-5e4f38688e4c14846b8264970a79c482c1ca7012.tar.gz
Initial commit
Diffstat (limited to 'rapport.md')
-rw-r--r--rapport.md62
1 files changed, 62 insertions, 0 deletions
diff --git a/rapport.md b/rapport.md
new file mode 100644
index 0000000..9293480
--- /dev/null
+++ b/rapport.md
@@ -0,0 +1,62 @@
1EIG-20210 - Rapport de projet Open Data en Python
2=================================================
3
4Date : Octobre 2014
5Auteurs :
6 - Pacien TRAN-GIRARD
7 - Rémi NICOLE
8
9
10TL;DR
11-----
12
13Banapedia ressence les bannissements effectifs d'utilisateurs anonymes de Wikipédia, l'encyclopédie libre.
14
15
16Contexte de l'étude
17-------------------
18
19L'encyclopédie libre participative Wikipédia met à contribution ses usagers afin de s'améliorer.
20Cependant, face aux abus de certains, les administrateurs du site ont été contraints de banir tout bonnement les personnes mal intentionnées.
21
22
23### Choix des données
24
25Ces bannissements étant le reflet d'éventuelles mésactions, il serait intéressant d'étudier leurs localisations ainsi que leurs durées liées à l'importance du délit.
26En plus de localiser les méchants pas beaux, il pourrait s'avérer pertinent de relier la sévérité des bannissements aux pays, puisque l'on peut imaginer que certains modérateurs auraient la main un peu lourde lorsqu'il s'agirait d'un pays connu pour être la source de spams.
27
28
29### Source des données
30
31Wikipédia met à disposition un ensemble de données, dont les bannissements par utilisateurs, à disposition via une API plutôt pratique d'utilisation, bien que limitée au niveau du nombre de requêtes (ce qui est embêtant...).
32
33
34Résulats obtenus
35----------------
36
37### Histogramme du nombre de bannissements par durées
38
39Les bannissements durent le plus souvent un an, un mois, ou bien de deux à trois ans.
40La durée parfois longue est conforme aux [règles définies sur Wikipédia](http://en.wikipedia.org/wiki/Wikipedia:Banning_policy#Duration_of_bans).
41
42
43### Carte du nombre de bannissements par pays
44
45Les États-Unis et la Chine sont les pays avec le plus grand nombre de bannissements.
46Ceci peut être corrélé au nombre d'habitants, ou encore au nombre d'ordinateurs ayant une adresse IP publique dans les universités, qui servent souvent de proxies ouvert exploités par des vandales.
47
48
49### Carte de la durée de bannissement moyen par pays
50
51Les pays ayant les plus grandes durées de bannissement se révèlent être la Bulgarie, l'Uruguay et le Nicaragua.
52Ceci soulève des interrogations.
53
54
55 ???
56 ???
57 _______
58 /
59 /
60 /
61/
62