Bonjour,

Je suis actuellement apprenti au sein du Grand Paris Sud Est Avenir.
On m'a chargé de réaliser une études sur des données de fréquentations. Pourriez-vous me donner votre avis sur la méthodologie utilisée ?

Outils : Python

Données :
Données de fréquentation à l'échelle IRIS, fournies par Orange. On a le volume moyen de personne pour chaque jour dans un mois, sur chaque tranche d'heure de 30 minutes, pour chaque IRIS.
Nombre de restaurants par IRIS.
Nombre d'équipements de loisirs par IRIS.

Objectifs :
- comprendre l'évolution de la fréquentation,
- comprendre les taux de variations de la fréquentation avant et après le confinement de mars 2020

Méthodologie :
Pour chaque IRIS, j'ai calculé la moyenne de la fréquentation entre 18h et 23h, pour les mois de décembre 2019, mars 2020 et juillet 2020.
A partir de là, j'ai ensuite calculé le taux de variation de la fréquentation moyenne entre décembre 2019 et mars 2020, mars 2020 et juillet 2020.
Cartographiquement, on peut voir des différences entre les IRIS. Et j'ai donc calculé un I de Moran global, qui révèle une tendance globale à la concentration. Puis un I de Moran local, avec un voisinage de 5. Ce I local révèle les clusters.
A ce stade, ma question est de savoir si tout est "juste" sur le plan méthodologique. Est-ce qu'il y a des vérifications en amont à faire ? Est-ce que les deux indicateurs statistiques sont bien utilisés ?

Ensuite, j'ai réalisé une analyse de variance, pour savoir s'il existait un lien entre le nombre de restaurants et la moyenne de variation de fréquentation, et le nombre d'équipement et la moyenne de variation de fréquentation. Avec un seuil de 5%, il y a bien un lien entre le nombre de restaurants et le taux de variation de la fréquentation moyenne.
En revanche, toutes les moyennes sont négatives (donc une perte entre deux dates). Donc on a globalement une baisse de la fréquentation, malgré une tendance à la hausse pour quelques IRIS.

Sur le plan méthodologique, est-ce qu'il y a des incohérences selon vous ?

Merci d'avance,

will7jL