Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    24 500
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 24 500
    Points : 162 534
    Points
    162 534

    Par défaut Sortie de scikit-learn 0.21 RC 2

    scikit-learn est l’une des bibliothèques de référence pour l’apprentissage automatique en Python (et même en dehors du langage). Sa popularité est notamment due au grand nombre d’algorithmes implémentés, mais aussi à l’interface extrêmement simple et cohérente, prévue pour simplifier la vie aux débutants (par exemple, tous les choix de paramètres par défaut devraient donner d’assez bons résultats).

    La version 0.21 RC 2 de la bibliothèque est maintenant sortie, peu avant la version finale. La grande nouveauté est que les plus anciennes versions de Python ne sont plus gérées : il faut absolument Python 3.5 ou plus récent (la version actuelle de Python étant la 3.7). En particulier, cela signifie que scikit-learn n'est plus compatible avec Python 2. Ce changement a permis de simplifier certaines parties de scikit-learn.

    Dans les nouvelles fonctionnalités majeures, on peut compter un nouvel algorithme de partitionnement des données, OPTICS. Ce dernier est une généralisation de DBSCAN, qui agrège des points selon leur proximité, sans imposer de forme a priori (contrairement aux k moyennes). OPTICS a surtout l'avantage d'avoir moins de paramètres à définir (DBSCAN requiert une distance maximale entre deux points pour qu'ils soient considérés comme faisant partie du même groupe, mais aussi un nombre minimal de points à retrouver à cette distance pour créer un groupe). Pour ce faire, l'algorithme fonctionne avec un graphe d'accessibilité entre points.

    Un nouvel algorithme de dopage à base d'arbres fait leur apparition : HistGradientBoosting, utilisable à la fois en classification et en régression. Cette implémentation cherche à fournir une bien meilleure performance que l'algorithme de dopage par gradient actuel, surtout pour des jeux de données de taille décente (plus de dix mille échantillons). Elle est cependant toujours expérimentale, ce qui signifie que toutes les fonctionnalités souhaitées ne sont pas encore implémentées et que l'API pourrait changer à l'avenir.

    L'imputation de valeurs manquantes dans un jeu de données peut se faire avec la classe IterativeImputer, qui décide des valeurs à utiliser de manière circulaire.

    Source : [scikit-learn] Release Candidate for Scikit-learn 0.21.
    Vous souhaitez participer aux rubriques Qt ou PyQt (tutoriels, FAQ, traductions), HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  2. #2
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    24 500
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 24 500
    Points : 162 534
    Points
    162 534

    Par défaut

    Et voici la version finale de scikit-learn 0.21. Cette bibliothèque Python est la référence en apprentissage automatique "traditionnel", c'est-à-dire sans réseaux neuronaux profonds (et sans besoin de matériel extravagant pour obtenir des résultats).

    Dans les grandes lignes, cette version abandonne totalement Python 2 (il faut maintenant Python 3.5 au minimum, la première version à apporter des annotations de type, par exemple). Dans les nouveaux algorithmes disponibles, on compte OPTICS pour le partitionnement des données et HistGradientBoosting pour le dopage à base d'arbres. Tous les détails dans l'annonce de la RC 2.

    Cette version est déjà disponible dans PyPI, donc à travers pip, mais pas encore officiellement dans Anaconda (il faut utiliser le dépôt Conda Forge).
    Vous souhaitez participer aux rubriques Qt ou PyQt (tutoriels, FAQ, traductions), HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

Discussions similaires

  1. Sortie de scikit-learn 0.20
    Par dourouc05 dans le forum Méthodes prédictives et apprentissage automatique
    Réponses: 0
    Dernier message: 06/10/2018, 00h52
  2. [scikit-learn] Différences entre LogisticRegression et LogisticRegressionCV
    Par foxrol dans le forum Méthodes prédictives et apprentissage automatique
    Réponses: 1
    Dernier message: 17/06/2016, 11h17
  3. regression knn avec scikit learn
    Par fafa isfan dans le forum Calcul scientifique
    Réponses: 1
    Dernier message: 14/06/2016, 11h02
  4. probléme d'utilisation de scikit learn avec une dataframe de pandas
    Par fafa isfan dans le forum Calcul scientifique
    Réponses: 1
    Dernier message: 13/06/2016, 11h45
  5. PCA et scikit-learn
    Par Fanuilos dans le forum Calcul scientifique
    Réponses: 1
    Dernier message: 14/12/2013, 20h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo