• Morgane Urli

JdB 20-23.17 4 faits étonnants sur les analyses statistiques


Le fait n°4 va vraiment vous étonner.

1. Première semaine : je commence mes analyses statistiques.

2. Deuxième semaine : je me plonge corps et âme dans mes analyses statistiques.

3. Troisième semaine : je mange, dors et rêve analyses statistiques.

4. Quatrième semaine : Contre toute attente, je n'ai pas encore fini mes analyses statistiques.

Trêve de plaisanterie. Je suis loin d'être au point du quatrième GIF (Il m'a fait rire, je ne pouvais pas ne pas le mettre.) A vrai dire, c'est même tout le contraire. Depuis un mois, je me rends compte de ma progression dans l'apprentissage du logiciel de statistiques R . Et ça fait du bien !

Je ne m'attendais pas à finir mes analyses statistiques en un mois. Je voulais me plonger dedans pendant quelques semaines pour m'approprier et explorer les données et faire quelques analyses préliminaires. L'école d'été que j'ai suivie début mai m'a permis non seulement d'apprendre un nouveau type d'analyses statistiques mais également de me rendre compte qu'il fallait que je prenne le temps d'apprendre certains packages de R ("dplyr" et "tidyr" et "RMarkdown" pour les connaisseurs) que j'avais mis de côté en me disant "un jour, j'apprendrais ces packages, mais là, je n'ai pas le temps".

Marteau, clou, tournevis ou perceuse ? Telle est la question

Lors de l'utilisation de logiciels quel qu'ils soient, on est souvent confronté au dilemme suivant face à la réalisation d'une tâche : la réaliser de manière inélégante nécessitant souvent une action répétitive et aboutissant à de nombreuses lignes de code (ce que j'appelle le mode "bourrin") ou la réaliser avec le code adapté en une ligne de code ! Je caricature un peu mais c'est l'idée. Toute la question réside dans l'équilibre entre le temps "perdu" à apprendre la méthode élégante et celui gagné lors de son application par la suite. Imaginez que vous ayez à votre disposition une boîte à outils avec un marteau, des clous, un tournevis, une règle et un crayon que vous savez utiliser. Cette boîte à outils représente les fonctions et les packages de R (éléments constitutifs du code) que vous savez utiliser. Vous devez réaliser un trou de 2 mm de diamètre dans votre mur en placoplatre avec uniquement votre boîte à outils. Vous utilisez la règle pour mesurer le diamètre, le crayon pour faire une marque sur le mur, le marteau et un clou pour commencer à faire un trou et vous peaufiner les bords du trou en grattant le plâtre avec le tournevis. En 10 minutes vous avez réalisé un trou semblable à votre attente. Ce n'est pas une méthode conventionnelle, ni très élégante mais en 10 minutes, vous avez réalisé un trou correct. C'est le mode "bourrin" ! Maintenant, vous connaissez l'existence de la perceuse (une autre fonction sous R), mais vous ne savez pas vous en servir ! Vous passez une demi-heure à lire le mode d'emploi, puis vous trouvez le bon foret et vous percez le trou dans le mur en 30 secondes. C'est élégant, fait dans les règles de l'art et le trou est correcte. Vous avez mis une demi heure et 30 secondes. Si avec les deux méthodes les deux trous sont identiques et semblables à vos attentes, quelle méthode choisir ? La plus rapide et "bourrin" ou l'élégante mais plus longue ? Pour répondre à cette question, il faut avant se poser une autre question. Vais-je avoir besoin de faire beaucoup de trous dans des murs en placoplatre par la suite ou non ? Si vous savez que c'est le seul trou que vous allez faire dans votre vie. Vous pouvez vous économisez le temps de l'apprentissage d'utilisation de la perceuse (et accessoirement son prix avec) et appliquer le "mode bourrin". En 10 minutes, l'affaire est bouclée ! Mais si vous en avez une centaine à réaliser, ça vaut probablement la peine de "perdre" une demi-heure à apprendre à utiliser la perceuse pour ensuite mettre 30 secondes pour percer chaque trou. Pour résumer, si vous avez un unique trou à faire, la méthode "bourrin" se réalise en 10 min et la méthode élégante en 30min et 30s. Si vous avez 100 trous à faire, la méthode bourrin vous prendra 1000 min soit plus de 16h et la méthode élégante moins d'une heure trente.

Si la prise de décisions pour réaliser une tâche dans un logiciel de statistiques était aussi facile que pour réaliser un trou, ça se saurait. Les choses se compliquent car vous ne savez pas combien de temps vous allez mettre à apprendre la nouvelle fonction (l'utilisation de la perceuse) et vous ne savez pas non plus exactement si vous allez un jour avoir besoin de reproduire cette même tâche sur un autre jeu de données (c'est à dire combien de trous vous allez avoir à percer). Disons que vous avez juste une petite idée. Enfin, il y a des jours où vous êtes plus d'humeur à réaliser des tâches répétitives et d'autre où vous êtes avides d'apprendre toujours de nouvelles choses.

Bon, je reviens à mes moutons. Lors de cette école d'été, j'ai vu des gens utiliser ces fonctions et packages que j'avais mis de côté. Ils allaient tellement plus vite que moi pour organiser leurs jeux de données ! L'expérience des autres m'a permis de trancher : je vais apprendre à utiliser une perceuse, j'irai plus vite et j'obtiendrais un code plus clair ! Donc en mai dernier, j'ai pris le temps d'apprendre à l'utiliser en suivant des tutoriels existant sur le net. Et bien sûr, c'était la chose à faire ! En un mois, j'ai déjà largement regagner le temps "perdu" durant de l'apprentissage de ces packages, lors de leur application !

Plus de détails de ce dernier mois dans mon journal de bord twitteresque :


© 2020 by Morgane Urli.

  • Twitter Social Icon
  • LinkedIn Social Icon
  • photoResearch gate