Bonjour à tous,
Depuis ce matin je bloque sur un problème qui pourtant me semble énormément simple. Je dispose d'un dataframe (nommé "source") de ce type :
STEMI STROKE INFARCT YES NO UNANSWERED NO NO YES UNANSWERED YES NO
Comme vous le voyez, pour chaque variable, il y'a trois types de réponses possible : no, yes ou unanswered. Sachant qu'une variable peut n'avoir que des yes, ou que des no, ou yes et no etc...
Je veux à la fin obtenir un tableau qui regroupe simplement pour chaque variable le total de yes, le total de no et le total de unanswered pour chaque variable. Un truc tout simple quoi.
Et pourtant, je suis à deux doigts de jeter mon PC. J'ai parcouru tout les forums, tenté le package dplyr avec groupby and summarize, j'ai tenté de faire un dataframe à partir de table("source") (comme il n'y a pas tout le temps des yes/no/unanswered par variable, le nombre de lignes pour le dataframe varie, et donc il ne peut pas le faire). Evidemment, les sum() ne fonctionnent pas puisque ce sont des variables qualitatives.
Bref j'ai vraiment besoin de votre aide. Merci beaucoup !!
Fabien
Partager