En ce qui concerne R++, une amélioration possible par rapport à R serait une plus grande clarté sur les prises de décisions. Je pense en particulier à 2 points récents :
une discussion sur les algorithmes de calcul du tau de Kendall (voir plus bas), dont les conclusions me surprennent beaucoup. Ces conclusions, nécessiteraient à mon avis un vote, ou une validation quelconque, comme il en existe aussi bien chez SAS (SASware ballot) que chez Apache. Il faudrait penser à mettre en place ce genre de consultation.
la publication des logs de chargement de packages sur le miroir Rstudio : cette publication est très récente, alors qu'elle aurait été utile depuis longtemps. Elle donne en effet des idées sur l'utilité des différents packages.
Quelques détails sur discussion sur Kendall (http://r.789695.n4.nabble.com/Fast-K...td4634537.html) :
le tau de kendall a été proposé en 1938, un nouvel algorithme de calcul faisant passer la complexité de n^2 à n*log(n) (où n est le nombre d'obs) a été publié en 1966. Le calcul du tau dans R-base est le calcul long, et est de ce fait inutilisable si n>1e5.
En 2012, il y a une discussion pour savoir s'il faudrait changer cela, et la réponse est que puisque le calcul rapide existe déjà dans un package, et que le besoin est très spécialisé, autant pointer dans la doc sur le package en question. Je suis franchement en désaccord avec l'affirmation que ce besoin est très spécialisé, et donc avec ses conséquences.
Partager