IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Actualités Discussion :

Microsoft bat le record de tri des données

  1. #1
    Responsable .NET

    Avatar de Hinault Romaric
    Homme Profil pro
    Consultant
    Inscrit en
    Janvier 2007
    Messages
    4 570
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Consultant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2007
    Messages : 4 570
    Points : 252 372
    Points
    252 372
    Billets dans le blog
    121
    Par défaut Microsoft bat le record de tri des données
    Microsoft bat le record de tri des données
    avec une nouvelle technique qui sera implantée dans Bing


    Microsoft vient d’établir un nouveau record de tri des données au test MinuteSort, avec un nouveau procédé baptisé Flat Datacenter Storage (FDS), permettant de trier rapidement de grandes quantités de données.

    Pour rappel, le benchmark MinuteSort est un test qui mesure la quantité de données pouvant être triée en 60 secondes.

    Le système développé par les chercheurs de Microsoft a permis de trier 1401 Go de données en seulement une minute, battant ainsi le record de tri de 500 Go de données dans le même temps détenu par Yahoo depuis 2009.

    De plus, la technique utilisée par Microsoft nécessite moins de ressources. Le système utilise 1 033 disques et 250 machines alors que la procédure de Yahoo nécessite la présence de 5 624 disques et 1 406 machines.

    La procédure de tri FDS s’inspire de Google MapReduce, tel qu’il est implémenté dans Apache Hadoop, sauf que chaque serveur négocie le cluster de tri. Les chercheurs ont également utilisé une technologie supplémentaire du nom de « full bisection bandwidth networks » pour stimuler la bande passante, permettant à chaque ordinateur d’envoyer et recevoir environ 2Go de données par seconde.

    La nouvelle technique développée par Microsoft a été présentée à la conférence Association for Computing Machinery, destinée aux bases de données, cette semaine à Scottsdale, en Arizona.

    FDS sera également implanté dans le moteur de recherche Bing afin d’améliorer le temps de réponses aux requêtes des utilisateurs.


    Source : Microsoft Research

  2. #2
    Rédacteur/Modérateur


    Homme Profil pro
    Network game programmer
    Inscrit en
    Juin 2010
    Messages
    7 129
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : Canada

    Informations professionnelles :
    Activité : Network game programmer

    Informations forums :
    Inscription : Juin 2010
    Messages : 7 129
    Points : 33 061
    Points
    33 061
    Billets dans le blog
    4
    Par défaut

    Ceci est ma réaction en voyant les chiffres annoncés.
    C'est plus que bluffant. Ils ont explosé le précédent record.

  3. #3
    Modérateur
    Avatar de Rayek
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mars 2005
    Messages
    5 235
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Haute Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 235
    Points : 8 504
    Points
    8 504
    Par défaut
    Exploser cela dépend. On parle de machine mais est ce que c'est les même que celle de yahoo de 2009, car en 3 ans les processeurs/disque dur ont grandement évoluer.

    Entre un SSD et un DD SATA il y a un monde quand même (enfin il me semble).

    Mais cela n’empêche que c'est une belle performance.

  4. #4
    Invité
    Invité(e)
    Par défaut
    Même si les machines et disque ont évolués, cela reste une belle performance technique.

  5. #5
    Modérateur
    Avatar de grunk
    Homme Profil pro
    Lead dév - Architecte
    Inscrit en
    Août 2003
    Messages
    6 692
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Lead dév - Architecte
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2003
    Messages : 6 692
    Points : 20 243
    Points
    20 243
    Par défaut
    Qu'est qu'il faut comprendre par "tri des données" ? Quel type de données ?

    Parce que 1To sur 250 machines ça fait "que" 5Go par machine.

  6. #6
    Membre émérite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Septembre 2008
    Messages
    1 190
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 1 190
    Points : 2 659
    Points
    2 659
    Par défaut
    Citation Envoyé par Rayek Voir le message
    Exploser cela dépend. On parle de machine mais est ce que c'est les même que celle de yahoo de 2009, car en 3 ans les processeurs/disque dur ont grandement évoluer.

    Entre un SSD et un DD SATA il y a un monde quand même (enfin il me semble).

    Mais cela n’empêche que c'est une belle performance.
    Bien d'accord, en 3 ans les capacités techniques on déjà du plus que doublé.

  7. #7
    Membre actif
    Avatar de fmdao
    Profil pro
    Formateur en informatique
    Inscrit en
    Novembre 2010
    Messages
    90
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Loire (Auvergne)

    Informations professionnelles :
    Activité : Formateur en informatique

    Informations forums :
    Inscription : Novembre 2010
    Messages : 90
    Points : 210
    Points
    210
    Par défaut
    Des infos sur l'algorithme utilisé ?

  8. #8
    Membre éprouvé Avatar de jmnicolas
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2007
    Messages
    427
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Transports

    Informations forums :
    Inscription : Juin 2007
    Messages : 427
    Points : 976
    Points
    976
    Par défaut
    Oui il faudrait pouvoir distinguer le gain apporté par le matériel plus récent et celui apporté réellement par l'algorithme.
    Sinon ça n'a aucun sens : il leur suffit de racheter des machines plus performantes l'année prochaine et sans toucher à leur algo ils obtiendront un nouveau record.

    C'est un peu comme comparer les performances de pilotes de course, si les voitures ne sont pas identiques il est difficile de savoir qui est réellement le meilleur.

  9. #9
    Expert éminent sénior
    Profil pro
    Inscrit en
    Décembre 2007
    Messages
    6 807
    Détails du profil
    Informations personnelles :
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Décembre 2007
    Messages : 6 807
    Points : 32 103
    Points
    32 103
    Par défaut
    C'est vraiment un concours de celui qui a la plus grosse(machine).....

  10. #10
    Expert confirmé
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Novembre 2009
    Messages
    2 032
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur .NET

    Informations forums :
    Inscription : Novembre 2009
    Messages : 2 032
    Points : 5 470
    Points
    5 470
    Par défaut
    Citation Envoyé par deathness Voir le message
    Bien d'accord, en 3 ans les capacités techniques on déjà du plus que doublé.
    Peut être mais là il y a 5.6 fois moins de machine .
    Puis bon vous savez très bien que de nos jours les machines gagnent en puissance mais si on veut en profiter il faut également changé les algos ( multi core!)

  11. #11
    Membre émérite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Septembre 2008
    Messages
    1 190
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 1 190
    Points : 2 659
    Points
    2 659
    Par défaut
    Citation Envoyé par micka132 Voir le message
    Peut être mais là il y a 5.6 fois moins de machine .
    Puis bon vous savez très bien que de nos jours les machines gagnent en puissance mais si on veut en profiter il faut également changé les algos ( multi core!)
    Je ne dis pas que leur algo ou procédé n'est pas révolutionnaire ou non : je ne le connais pas en détail, et ne peut donc rien en dire.

    Mais sur l'aspect pur des chiffres, leur différence avec les anciens est à fortement mettre en corrélation avec l'évolution des machines et des réseaux!
    Et que donc les balancer, sans offrir de comparaison en terme de puissance et débit avec ceux de yahoo n'a pas de sens.

  12. #12
    Membre émérite
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Décembre 2008
    Messages
    832
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Décembre 2008
    Messages : 832
    Points : 2 621
    Points
    2 621
    Par défaut
    Accessoirement, l'un des problèmes du matos, c'est que le débit des disques dur n'a pas augmenté autant que la puissance de calcul brute.
    Du coup il faut quand même modérer ce fameux boost pour moi.

    Mais c'est sûr qu'on serait vraiment fixés si on avait les caract des machines.

  13. #13
    Expert confirmé Avatar de DonQuiche
    Inscrit en
    Septembre 2010
    Messages
    2 741
    Détails du profil
    Informations forums :
    Inscription : Septembre 2010
    Messages : 2 741
    Points : 5 493
    Points
    5 493
    Par défaut
    Jolie performance. Maintenant, s'ils pouvaient appliquer cette expertise pour améliorer la vitesse de tri de l'explorateur windows... Parce que sous W7 c'est assez pitoyable.

  14. #14
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Whoua, bon boulot, c'est impressionant.
    C'est vrai, c'est dommage qu'on n'ai pas plus de précisions sur l'algorithme employé, et sur l'architecture concernant le fonctionnement de toutes ces machines.

    Citation Envoyé par DonQuiche Voir le message
    Maintenant, s'ils pouvaient appliquer cette expertise pour améliorer la vitesse de tri de l'explorateur windows... Parce que sous W7 c'est assez pitoyable.
    Il y a un petit logiciel bien léger qui s'appelle "Everything", je te le conseille si ca t'arrive aussi d'avoir des recherches a faire. Les résultats de ce logiciel arrivent... instantanément (en meme temps que tu tape).

  15. #15
    Candidat au Club
    Profil pro
    Inscrit en
    Août 2005
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2005
    Messages : 1
    Points : 4
    Points
    4
    Par défaut
    Il y a pleins d'infos sur les machines, l'algo utilisé sur le site de sortbenchmark.org, ==> voir ce pdf de présentation

  16. #16
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Citation Envoyé par supergaou Voir le message
    Il y a pleins d'infos sur les machines, l'algo utilisé sur le site de sortbenchmark.org, ==> voir ce pdf de présentation
    Super, merci beaucoup
    C'est tres intéressant et instructif.

  17. #17
    Candidat au Club
    Homme Profil pro
    Ingénieur informaticien , Développeur .NET et Microsoft Student Partner
    Inscrit en
    Août 2009
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Sénégal

    Informations professionnelles :
    Activité : Ingénieur informaticien , Développeur .NET et Microsoft Student Partner
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2009
    Messages : 1
    Points : 2
    Points
    2
    Par défaut
    Des trucks de machines ou pas, Cette Technologie est super performante, encore Bravo Microsoft

  18. #18
    Membre chevronné Avatar de bernard59139
    Profil pro
    Retired
    Inscrit en
    Octobre 2006
    Messages
    957
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Retired

    Informations forums :
    Inscription : Octobre 2006
    Messages : 957
    Points : 2 072
    Points
    2 072
    Par défaut
    Je suis toujours épaté quand je vois ce genre de nouvelles.

    IBM n'est pas loin, 43 minutes to process the 6.5 TBs of metadata needed for a file system containing 10 Billion files

  19. #19
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Juin 2012
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2012
    Messages : 1
    Points : 0
    Points
    0
    Par défaut m$...
    En fait, comme a son habitude, Microsoft publie une idée pompée ailleurs...
    Je ne vois pas vraiment le truc révolutionnaire ici, c'est un Map/Reduce bricolé et vu les quantités de RAM sur les machines, j'imagine qu'ils traitent les données avec un hash table en cache, non ? Merci Google, Apache, NoSQL...

  20. #20
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Citation Envoyé par Erza3 Voir le message
    En fait, comme a son habitude, Microsoft publie une idée pompée ailleurs...
    Je ne vois pas vraiment le truc révolutionnaire ici, c'est un Map/Reduce bricolé et vu les quantités de RAM sur les machines, j'imagine qu'ils traitent les données avec un hash table en cache, non ? Merci Google, Apache, NoSQL...
    Chaqu'un prend des idées aux autres, il y a quoi d'anormal.
    Si a chaque fois une évolution devrait etre une découverte le monde n'évoluerais pas vite.
    Et si tu compares a Apache et NoSQL je pense que tu devrais citer Oracle et surtout IBM en premier lieu.

    Bravo Microsoft, j'espere maintenant que d'autres entreprises vont "pomper" sur MS comme tu dis et améliorer encore et encore ces résultats.

Discussions similaires

  1. Probléme tri des donnée de sortie
    Par jeannotmer dans le forum 4D
    Réponses: 10
    Dernier message: 12/07/2007, 15h57
  2. Sous formulaire, requete SQL et Tri des données
    Par yanouil dans le forum Requêtes et SQL.
    Réponses: 1
    Dernier message: 11/07/2007, 07h16
  3. [IN] - Tri des données
    Par kirsoul dans le forum Langage SQL
    Réponses: 1
    Dernier message: 02/05/2006, 15h36
  4. tri des données différent entre 2 bases
    Par j6m dans le forum Oracle
    Réponses: 2
    Dernier message: 12/03/2006, 10h17
  5. [JTable] Tri des données
    Par soulhouf dans le forum Composants
    Réponses: 7
    Dernier message: 08/09/2005, 14h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo