IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Comparaison de ''.join(ch.split()) et ch.replace(' ','')


Sujet :

Python

  1. #1
    Membre Expert
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    1 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 1 418
    Par défaut Comparaison de ''.join(ch.split()) et ch.replace(' ','')
    Dans une autre file, j'ai proposé une instruction
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ch = ch.replace('\n','')
    sur une chaine ne contenant pas autre chose que des chiffres et des '\n'

    Un autre a proposé
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ch = ''.join(ch.split())
    http://www.developpez.net/forums/d66...e/#post3907798

    Ce que voyant, j'ai pensé que join devait être plus lent parce que:
    - ch.split() crée d'abord une liste
    - puis ''.join() accole tous les éléments de la liste
    tandis que
    - ch.replace() me semble agir sur ch directement sans intermédiaire.

    Comme ce n'était qu'une impression, j'ai écrit ceci pour vérifier:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    ch = """
    37107287533902102798797998220837590246510135740250
    46376937677490009712648124896970078050417018260538
    74324986199524741059474233309513058123726617309629
    91942213363574161572522430563301811072406154908250
    23067588207539346171171980310421047513778063246676
    89261670696623633820136378418383684178734361726757
    28112879812849979408065481931592621691275889832738
    44274228917432520321923589422876796487670272189318
    47451445736001306439091167216856844588711603153276
    70386486105843025439939619828917593665686757934951
    62176457141856560629502157223196586755079324193331
    64906352462741904929101432445813822663347944758178
    92575867718337217661963751590579239728245598838407
    58203565325359399008402633568948830189458628227828
    80181199384826282014278194139940567587151170094390
    35398664372827112653829987240784473053190104293586
    86515506006295864861532075273371959191420517255829
    71693888707715466499115593487603532921714970056938
    54370070576826684624621495650076471787294438377604
    53282654108756828443191190634694037855217779295145
    36123272525000296071075082563815656710885258350721
    45876576172410976447339110607218265236877223636045
    17423706905851860660448207621209813287860733969412
    81142660418086830619328460811191061556940512689692
    51934325451728388641918047049293215058642563049483
    62467221648435076201727918039944693004732956340691
    15732444386908125794514089057706229429197107928209
    55037687525678773091862540744969844508330393682126
    18336384825330154686196124348767681297534375946515
    80386287592878490201521685554828717201219257766954
    78182833757993103614740356856449095527097864797581
    16726320100436897842553539920931837441497806860984
    48403098129077791799088218795327364475675590848030
    87086987551392711854517078544161852424320693150332
    59959406895756536782107074926966537676326235447210
    69793950679652694742597709739166693763042633987085
    41052684708299085211399427365734116182760315001271
    65378607361501080857009149939512557028198746004375
    35829035317434717326932123578154982629742552737307
    94953759765105305946966067683156574377167401875275
    88902802571733229619176668713819931811048770190271
    25267680276078003013678680992525463401061632866526
    36270218540497705585629946580636237993140746255962
    24074486908231174977792365466257246923322810917141
    91430288197103288597806669760892938638285025333403
    34413065578016127815921815005561868836468420090470
    23053081172816430487623791969842487255036638784583
    11487696932154902810424020138335124462181441773470
    63783299490636259666498587618221225225512486764533
    67720186971698544312419572409913959008952310058822
    95548255300263520781532296796249481641953868218774
    76085327132285723110424803456124867697064507995236
    37774242535411291684276865538926205024910326572967
    23701913275725675285653248258265463092207058596522
    29798860272258331913126375147341994889534765745501
    18495701454879288984856827726077713721403798879715
    38298203783031473527721580348144513491373226651381
    34829543829199918180278916522431027392251122869539
    40957953066405232632538044100059654939159879593635
    29746152185502371307642255121183693803580388584903
    41698116222072977186158236678424689157993532961922
    62467957194401269043877107275048102390895523597457
    23189706772547915061505504953922979530901129967519
    86188088225875314529584099251203829009407770775672
    11306739708304724483816533873502340845647058077308
    82959174767140363198008187129011875491310547126581
    97623331044818386269515456334926366572897563400500
    42846280183517070527831839425882145521227251250327
    55121603546981200581762165212827652751691296897789
    32238195734329339946437501907836945765883352399886
    75506164965184775180738168837861091527357929701337
    62177842752192623401942399639168044983993173312731
    32924185707147349566916674687634660915035914677504
    99518671430235219628894890102423325116913619626622
    73267460800591547471830798392868535206946944540724
    76841822524674417161514036427982273348055556214818
    97142617910342598647204516893989422179826088076852
    87783646182799346313767754307809363333018982642090
    10848802521674670883215120185883543223812876952786
    71329612474782464538636993009049310363619763878039
    62184073572399794223406235393808339651327408011116
    66627891981488087797941876876144230030984490851411
    60661826293682836764744779239180335110989069790714
    85786944089552990653640447425576083659976645795096
    66024396409905389607120198219976047599490197230297
    64913982680032973156037120041377903785566085089252
    16730939319872750275468906903707539413042652315011
    94809377245048795150954100921645863754710598436791
    78639167021187492431995700641917969777599028300699
    15368713711936614952811305876380278410754449733078
    40789923115535562561142322423255033685442488917353
    44889911501440648020369068063960672322193204149535
    41503128880339536053299340368006977710650566631954
    81234880673210146739058568557934581403627822703280
    82616570773948327592232845941706525094512325230608
    22918802058777319719839450180888072429661980811197
    77158542502016545090413245809786882778948721859617
    72107838435069186155435662884062257473692284509516
    20849603980134001723930671666823555245252804609722
    53503534226472524250874054075591789781264330331690
    """
     
    from timeit import Timer
     
    def f(x):
        return x.replace('\n','')
    def g(x):
        return ''.join(x.split())
     
    iterations = 1000
    tf = Timer('f(ch)','from __main__ import f,ch').timeit(iterations)
    tg = Timer('g(ch)','from __main__ import g,ch').timeit(iterations)
    print "timeit unique d'execution de x.replace('\\n','') :",tf
    print "timeit unique d'execution de ''.join(x.split()) :",tg
     
     
    repet = 5
    litf = Timer('f(ch)','from __main__ import f,ch').repeat(repet,iterations)
    litg = Timer('g(ch)','from __main__ import g,ch').repeat(repet,iterations)
    print "\n\ntemps d'execution de x.replace('\n','')"
    s = 0
    for y in litf:
        print y
        s = s+y
    print "temps moyen d'execution de x.replace('\\n','') : ",s/repet
     
    print "\n\ntemps d'execution de ''.join(x.split())"
    s = 0
    for y in litg:
        print y
        s = s+y
    print "temps moyen d'execution de ''.join(x.split()) : ",s/repet
    Un résultat:

    timeit unique d'execution de x.replace('\n','') : 0.0666693671963
    timeit unique d'execution de ''.join(x.split()) : 0.59933036182


    temps d'execution de x.replace('
    ','')
    0.0674348276109
    0.0722999710856
    0.0679594752964
    0.0671792085307
    0.066221544917
    temps moyen d'execution de x.replace('\n','') : 0.0682190054881


    temps d'execution de ''.join(x.split())
    0.621630961477
    0.745448932755
    0.590873141698
    0.588458309646
    0.588839084297
    temps moyen d'execution de ''.join(x.split()) : 0.627050085975
    ''.join(ch.split()) est 14 fois plus long que ch.replace('\n','') !


    Cependant l'algorithme de split() n'est pas le même que celui de replace():
    «If sep is not specified or is None, a different splitting algorithm is applied. First, whitespace characters (spaces, tabs, newlines, returns, and formfeeds) are stripped from both ends.»
    J'ai mis des blancs et des '\t' en plus dans la chaine ch précédente et j'ai refait tourner avec le code suivant:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    ch = """
    371072875339021027987979982208 37590246\t510135740250
    4637693767749000971264812 4896970078050\t417018260538
    743249861 99524741059474233309513058123\t726617309629
    919422133635 741615725224305633018110\t724 06154908250
    23067588207 5393461711719 8031042104\t7513778063246676
    8926167069662363382 013637841 83836\t84178734361726757
    28112879812849979 4080654819315926\t21691275889832738
    442742289174325203 219235894228\t76796487670272189318
    47451445 736001306439091167216\t856844588711603153276
    703864861058430  25439939619828\t917593665686757934951
    621764571418565606295021572231\t96586755079324193331
    649063524627419049291014324458\t13822663347944758178
    925758677183 37217661963751590\t579239728245598838407
    58203565325359399008402633568\t948830189458628227828
    8018119938482  62820142781941\t3994 0567587151170094390
    35398664372827112653829987240\t784473053190104293586
    8651550600629586486  15320\t75273371959191420517255829
    71693888707  71546649911\t5593487603532921714970056938
    54370070576 8266846\t246\t21495650076471787294438377604
    532826541  0875682\t8443191190634694037855217779295145
    3612327252\t5000296071075082563815656710885258350721
    458765761\t72410976447339110607218265236\t877223636045
    174237069058  51860660448207621209 81\t3287860733969412
    8114266041808683061932846081 119\t1061556940512689692
    519343254517283886419180  47049\t293215058642563049483
    6246722164843507 620172791803994\t4693004732956340691
    1573244438690812579  45140890577\t06229429197107928209
    55037687525678773091862  5407449\t69844508330393682126
    183363848 2533015468619612434876768\t1297534375946515
    803862875928 78490201521685554828717\t201219257766954
    78182833757993103614740356856 449095\t527097864797581
    1672632010043689784255353992093183744\t1497806860984
    484030\t9812907779179908821879  5327364475675590848030
    870869\t87551392711854517078544 161852424320693150332
    59959406\t895756536782107074926 966537676326235447210
    69793950\t679652694742597709739 166693763042633987085
    4105268470\t829908521139942736573 4116182760315001271
    6537860736150\t10808570091499395125 57028198746004375
    3582903531743471732\t6932123578154982 629742552737307
    949537597651053059\t469660676831565743 77167401875275
    8890280257173322\t96191  76668713819931811 048770190271
    25267680276078003013678 680992525463401061632866526
    3627021854049\t770558562994  6580636237993140746255962
    2407448690823\t117497779236546  6257246923322810917141
    9143028\t8197103288597806669\t7 60892938638285025333403
    34413065578016127815 21815\t005561868836468420090470
    23053081172816 4304876237919\t69842487255036638784583
    1148769693215490281042402 01383351\t24462181441773470
    6378329949063625966649858761 82212\t25225512486764533
    67720186971698544312419 57240991395\t9008952310058822
    9554825530026352 0781532296796249481641953868218774
    7608532713228572311042 4803456124867\t697064507995236
    37774242535411291684276  86553892620\t5024910326572967
    237019132757256 75285653248258265463092207058596522
    2979886027225  8331913126375147341\t994889534765745501
    184957014548792889  8485682772607\t7713721403798879715
    38298203783031473527721 58\t0348144513491373226651381
    3482954382919991 818027891\t6522431027392251122869539
    4095795306640523 263253804\t4100059654939159879593635
    29746152185502 3713076422\t55121183693803580388584903
    4169811622207297718615823\t6678424689157993532961922
    6246795719440126904387\t710 5048102390895523597457
    2318970677\t25479150615055049 53922979530901129967519
    861880882\t2587 5314529584099251203829 009407770775672
    1130673970830\t4724483816533873502340845647058077308
    82959174767140363198008\t187 129011875491310547126581
    9762333104481838626951545\t6334926366572897563400500
    4284628018351707052 783183\t9425882145521227251250327
    551216035469812005817  6\t21652 12827652751691296897789
    3223819\t573432 9339946437501907836945765883352399886
    75506164965\t1847751807381688378610 91527357929701337
    621778427521926234\t0194239963916  8044983993173312731
    32924185707 147349566 9\t16674687634660915035914677504
    9951867143023 52196 288948901\t02423325116913619626622
    732674608005 915474718307 98  \t92868535206946944540724
    768418225246744171615 14 03642798227\t3348055556214818
    971426179103425986472 0451689398942\t2179826088076852
    87783646182799346 3137677543\t0780936333018982642090
    1084880252167467 08832\t151201858 83543223812876952786
    7132961247 478246 4538\t636993009049310363619763878039
    62184073 5723997942234\t06235393808339651327408011116
    66627891981488087797 941\t876876144230030984490851411
    60661826293682836764744\t779 239180335110989069790714
    85786944089552990 653640\t447 425576083659976645795096
    6602439640990538\t9 607120198 2199760 47599490197230297
    649139826800329\t73156037120 041377903785566085089252
    16730939319872750 275468906 903707539413042652315011
    948093772450487951509541\t00921645863754710598436791
    786391670211874\t92431\t995700 641917969777599028300699
    1536871371193\t661495281130 5876380278410754449733078
    4078992311553\t55625611423 22423255033685442488917353
    448899115014406\t48020  299340368006977710650566631954
    8123488067321\t014673 9058568557934581403627822703280
    82616570773948\t32759 2232845941706525094512325230608
    229188020587\t773197  19839450180888072429661980811197
    77158542502\t016545090413245809786882778948721859617
    7210783843\t506918615 5435 662884062257473692284509516
    208496039801340\t017239 30671666823555245252804609722
    53503534226472\t5242508 74054075591789781264330331690
    """
     
    from timeit import Timer
     
    def f(x):
        return x.replace('\n','').replace('\t','').replace(' ','')
    def g(x):
        return ''.join(x.split())
     
     
     
    iterations = 1000
    tf = Timer('f(ch)','from __main__ import f,ch').timeit(iterations)
    tg = Timer('g(ch)','from __main__ import g,ch').timeit(iterations)
    print "timeit unique d'execution de \nx.replace('\\n','').replace('\t','').replace(' ','') :",tf
    print "\ntimeit unique d'execution de ''.join(x.split()) :",tg
     
     
    repet = 5
    litf = Timer('f(ch)','from __main__ import f,ch').repeat(repet,iterations)
    litg = Timer('g(ch)','from __main__ import g,ch').repeat(repet,iterations)
    print "\n\ntemps d'execution de \nx.replace('\\n','').replace('\t','').replace(' ','')"
    s = 0
    for y in litf:
        print y
        s = s+y
    print "temps moyen d'execution de \nx.replace('\\n','').replace('\t','').replace(' ','') : ",s/repet
     
    print "\n\ntemps d'execution de ''.join(x.split())"
    s = 0
    for y in litg:
        print y
        s = s+y
    print "temps moyen d'execution de ''.join(x.split()) : ",s/repet
    Un résultat est:

    timeit unique d'execution de
    x.replace('\n','').replace(' ','').replace(' ','') : 0.232102124711

    timeit unique d'execution de ''.join(x.split()) : 0.758338001059


    temps d'execution de
    x.replace('\n','').replace(' ','').replace(' ','')
    0.22598039695
    0.257463727932
    0.289331744677
    0.290138271763
    0.263226750886
    temps moyen d'execution de
    x.replace('\n','').replace(' ','').replace(' ','') : 0.265228178442


    temps d'execution de ''.join(x.split())
    0.748900488749
    0.748025237845
    0.80621615317
    0.870644453415
    0.741912449767
    temps moyen d'execution de ''.join(x.split()) : 0.783139756589
    replace('\n','').replace(' ','').replace(' ','') est un peu moins rapide mais reste 3 fois plus rapide que split()

  2. #2
    Membre Expert
    Avatar de DelphiManiac
    Homme Profil pro
    Homme à tout faire
    Inscrit en
    Mars 2002
    Messages
    1 147
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Homme à tout faire
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2002
    Messages : 1 147
    Par défaut
    Si tu veux comparer, essayes de comparer ce qui est comparable, c'est à dire :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    return x.replace('\n','')
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    return ''.join(x.split('\n'))
    Et sur ce test je n'ai qu'un écart beaucoup plus petit.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    timeit unique d'execution de x.replace('\n','') : 0.0100910869957
    timeit unique d'execution de ''.join(x.split()) : 0.0132992461332
     
     
    temps d'execution de x.replace('
    ','')
    0.00976017901717
    0.00937004563429
    0.00982443299358
    0.00974732822188
    0.00985970283933
    temps moyen d'execution de x.replace('\n','') :  0.00971233774125
     
     
    temps d'execution de ''.join(x.split())
    0.013006750858
    0.0129642873605
    0.0130245603841
    0.0129768587907
    0.0129485032316
    temps moyen d'execution de ''.join(x.split()) :  0.012984192125
    D'autre part, tu dis au début :
    tandis que
    - ch.replace() me semble agir sur ch directement sans intermédiaire.
    Un string en python est "immutable" (non modifiable), cela passe toujours pas une copie, d'autre part, tu peux remplacer des chaines de n'importe longueur, ce qui sous entend bien une analyse de la chaîne caractères par caractères et une copie dans une nouvelle chaîne.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> a = 'tota'
    >>> a.replace ('to', 'titi')
    'titita'
    Sur le fond tu as raison donc, replace est plus rapide, mais bon ce n'est pas ce que je recherche en priorité dans python

  3. #3
    Membre Expert
    Homme Profil pro
    Inscrit en
    Mars 2007
    Messages
    941
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2007
    Messages : 941
    Par défaut
    Bon, pour le fun, j'ai une version encore 3 fois plus rapide, en utilisant translate au lieu de replace:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    ch = """
    371072875339021027987979982208 37590246\t510135740250
    4637693767749000971264812 4896970078050\t417018260538
    743249861 99524741059474233309513058123\t726617309629
    919422133635 741615725224305633018110\t724 06154908250
    23067588207 5393461711719 8031042104\t7513778063246676
    8926167069662363382 013637841 83836\t84178734361726757
    28112879812849979 4080654819315926\t21691275889832738
    442742289174325203 219235894228\t76796487670272189318
    47451445 736001306439091167216\t856844588711603153276
    703864861058430  25439939619828\t917593665686757934951
    621764571418565606295021572231\t96586755079324193331
    649063524627419049291014324458\t13822663347944758178
    925758677183 37217661963751590\t579239728245598838407
    58203565325359399008402633568\t948830189458628227828
    8018119938482  62820142781941\t3994 0567587151170094390
    35398664372827112653829987240\t784473053190104293586
    8651550600629586486  15320\t75273371959191420517255829
    71693888707  71546649911\t5593487603532921714970056938
    54370070576 8266846\t246\t21495650076471787294438377604
    532826541  0875682\t8443191190634694037855217779295145
    3612327252\t5000296071075082563815656710885258350721
    458765761\t72410976447339110607218265236\t877223636045
    174237069058  51860660448207621209 81\t3287860733969412
    8114266041808683061932846081 119\t1061556940512689692
    519343254517283886419180  47049\t293215058642563049483
    6246722164843507 620172791803994\t4693004732956340691
    1573244438690812579  45140890577\t06229429197107928209
    55037687525678773091862  5407449\t69844508330393682126
    183363848 2533015468619612434876768\t1297534375946515
    803862875928 78490201521685554828717\t201219257766954
    78182833757993103614740356856 449095\t527097864797581
    1672632010043689784255353992093183744\t1497806860984
    484030\t9812907779179908821879  5327364475675590848030
    870869\t87551392711854517078544 161852424320693150332
    59959406\t895756536782107074926 966537676326235447210
    69793950\t679652694742597709739 166693763042633987085
    4105268470\t829908521139942736573 4116182760315001271
    6537860736150\t10808570091499395125 57028198746004375
    3582903531743471732\t6932123578154982 629742552737307
    949537597651053059\t469660676831565743 77167401875275
    8890280257173322\t96191  76668713819931811 048770190271
    25267680276078003013678 680992525463401061632866526
    3627021854049\t770558562994  6580636237993140746255962
    2407448690823\t117497779236546  6257246923322810917141
    9143028\t8197103288597806669\t7 60892938638285025333403
    34413065578016127815 21815\t005561868836468420090470
    23053081172816 4304876237919\t69842487255036638784583
    1148769693215490281042402 01383351\t24462181441773470
    6378329949063625966649858761 82212\t25225512486764533
    67720186971698544312419 57240991395\t9008952310058822
    9554825530026352 0781532296796249481641953868218774
    7608532713228572311042 4803456124867\t697064507995236
    37774242535411291684276  86553892620\t5024910326572967
    237019132757256 75285653248258265463092207058596522
    2979886027225  8331913126375147341\t994889534765745501
    184957014548792889  8485682772607\t7713721403798879715
    38298203783031473527721 58\t0348144513491373226651381
    3482954382919991 818027891\t6522431027392251122869539
    4095795306640523 263253804\t4100059654939159879593635
    29746152185502 3713076422\t55121183693803580388584903
    4169811622207297718615823\t6678424689157993532961922
    6246795719440126904387\t710 5048102390895523597457
    2318970677\t25479150615055049 53922979530901129967519
    861880882\t2587 5314529584099251203829 009407770775672
    1130673970830\t4724483816533873502340845647058077308
    82959174767140363198008\t187 129011875491310547126581
    9762333104481838626951545\t6334926366572897563400500
    4284628018351707052 783183\t9425882145521227251250327
    551216035469812005817  6\t21652 12827652751691296897789
    3223819\t573432 9339946437501907836945765883352399886
    75506164965\t1847751807381688378610 91527357929701337
    621778427521926234\t0194239963916  8044983993173312731
    32924185707 147349566 9\t16674687634660915035914677504
    9951867143023 52196 288948901\t02423325116913619626622
    732674608005 915474718307 98  \t92868535206946944540724
    768418225246744171615 14 03642798227\t3348055556214818
    971426179103425986472 0451689398942\t2179826088076852
    87783646182799346 3137677543\t0780936333018982642090
    1084880252167467 08832\t151201858 83543223812876952786
    7132961247 478246 4538\t636993009049310363619763878039
    62184073 5723997942234\t06235393808339651327408011116
    66627891981488087797 941\t876876144230030984490851411
    60661826293682836764744\t779 239180335110989069790714
    85786944089552990 653640\t447 425576083659976645795096
    6602439640990538\t9 607120198 2199760 47599490197230297
    649139826800329\t73156037120 041377903785566085089252
    16730939319872750 275468906 903707539413042652315011
    948093772450487951509541\t00921645863754710598436791
    786391670211874\t92431\t995700 641917969777599028300699
    1536871371193\t661495281130 5876380278410754449733078
    4078992311553\t55625611423 22423255033685442488917353
    448899115014406\t48020  299340368006977710650566631954
    8123488067321\t014673 9058568557934581403627822703280
    82616570773948\t32759 2232845941706525094512325230608
    229188020587\t773197  19839450180888072429661980811197
    77158542502\t016545090413245809786882778948721859617
    7210783843\t506918615 5435 662884062257473692284509516
    208496039801340\t017239 30671666823555245252804609722
    53503534226472\t5242508 74054075591789781264330331690
    """
     
    from timeit import Timer
     
    def f(x):
        return x.replace('\n','').replace('\t','').replace(' ','')
     
    from string import maketrans
    tbl = maketrans('','')
    def g(x):
        return x.translate(tbl, '\n\t ')
     
     
     
    iterations = 1000
    tf = Timer('f(ch)','from __main__ import f,ch').timeit(iterations)
    tg = Timer('g(ch)','from __main__ import g,ch').timeit(iterations)
    print "timeit unique d'execution de \nx.replace('\\n','').replace('\\t','').replace(' ','') :",tf
    print "\ntimeit unique d'execution de x.translate(tbl, '\\n\\t ') :",tg
     
    repet = 5
    litf = Timer('f(ch)','from __main__ import f,ch').repeat(repet,iterations)
    litg = Timer('g(ch)','from __main__ import g,ch').repeat(repet,iterations)
    print "\n\ntemps d'execution de \nx.replace('\\n','').replace('\\t','').replace(' ','')"
    s = 0
    for y in litf:
        print y
        s = s+y
    print "temps moyen d'execution de \nx.replace('\\n','').replace('\\t','').replace(' ','') : ",s/repet
     
    print "\n\ntemps d'execution de x.translate(tbl, '\\n\\t ')"
    s = 0
    for y in litg:
        print y
        s = s+y
    print "temps moyen d'execution de x.translate(tbl, '\\n\\t ') : ",s/repet
    timeit unique d'execution de
    x.replace('\n','').replace('\t','').replace(' ','') : 0.0399215542757

    timeit unique d'execution de x.translate(tbl, '\n\t ') : 0.0126907190718


    temps d'execution de
    x.replace('\n','').replace('\t','').replace(' ','')
    0.0386314461754
    0.0385878652175
    0.0391007795684
    0.0398282463274
    0.0399746336476
    temps moyen d'execution de
    x.replace('\n','').replace('\t','').replace(' ','') : 0.0392245941872


    temps d'execution de x.translate(tbl, '\n\t ')
    0.0125831635026
    0.0125488015935
    0.0125105285728
    0.0127253603461
    0.0130276334003
    temps moyen d'execution de x.translate(tbl, '\n\t ') : 0.0126790974831

  4. #4
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Janvier 2007
    Messages : 56
    Par défaut [FAQ] A rajouté dans la FAQ ?
    Voilà un post intéressant qui mériterais d'allez dans la FAQ !!
    Ce serait dommage de le perdre dans les méandres du forum
    a+

  5. #5
    Membre Expert
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    1 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 1 418
    Par défaut
    Objection acceptée, DelphiMan. Tu as tout à fait raison.
    Mais j'ai comparé ma proposition à celle que tu avais faite.
    Rajouter '\n' diminue la "lenteur" de celle-ci, mais même si ce retour de ligne y avait été , je me serais posé la question. À laquelle j'ai mal répondu, c'est vrai.

    Je sentais bien qu'il y avait quelque chose qui n'allait pas. C'est pourquoi après avoir comparé à tort
    x.replace('\n','') et ''.join(x.split())
    j'ai ressenti le besoin de comparer
    x.replace('\n','').replace('\t','').replace(' ','')
    et
    ''.join(x.split())
    Mais cette deuxième comparaison n'est toujours pas valable puisque split() sans argument en fait tout de même plus que les 3 replace() ci-dessus:
    «If sep is not specified or is None, a different splitting algorithm is applied. First, whitespace characters (spaces, tabs, newlines, returns, and formfeeds) are stripped from both ends. Then, words are separated by arbitrary length strings of whitespace characters. Consecutive whitespace delimiters are treated as a single delimiter ("'1 2 3'.split()" returns "['1', '2', '3']"). »
    Seule la façon de faire de DelphiMan est la vraie bonne façon.

    La comparaison de x.replace('\n','') et ''.join(x.split('\n')) avec iterations = 1000 et repet = 5 donne encore des résultats notablement variables.
    J'ai lancé le programme avec iterations = 100000 et repet = 12 pour tendre vers quelque chose de plus représentatif.
    Sur la lancée, j'ai aussi inclus re.sub('\n','',x) dans la comparaison. Comme je m'en doutais, c'est la plus lente.

    Nota: j'ai mis des print ch[0:80] un peu partout pour être sûr que tous les calculs se font sur la même base de chaine ch de départ.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    ch = """37\t1072875339021027987979982208 37590246\t510135740250
    4\t637693767749000971264812 4896970078050\t417018260538
    743249861 99524741059474233309513058123\t726617309629
    919422133635 741615725224305633018110\t724 06154908250
    23067588207 5393461711719 8031042104\t7513778063246676
    8926167069662363382 013637841 83836\t84178734361726757
    28112879812849979 4080654819315926\t21691275889832738
    442742289174325203 219235894228\t76796487670272189318
    47451445 736001306439091167216\t856844588711603153276
    703864861058430  25439939619828\t917593665686757934951
    621764571418565606295021572231\t96586755079324193331
    649063524627419049291014324458\t13822663347944758178
    925758677183 37217661963751590\t579239728245598838407
    58203565325359399008402633568\t948830189458628227828
    8018119938482  62820142781941\t3994 0567587151170094390
    35398664372827112653829987240\t784473053190104293586
    8651550600629586486  15320\t75273371959191420517255829
    71693888707  71546649911\t5593487603532921714970056938
    54370070576 8266846\t246\t21495650076471787294438377604
    532826541  0875682\t8443191190634694037855217779295145
    3612327252\t5000296071075082563815656710885258350721
    458765761\t72410976447339110607218265236\t877223636045
    174237069058  51860660448207621209 81\t3287860733969412
    8114266041808683061932846081 119\t1061556940512689692
    519343254517283886419180  47049\t293215058642563049483
    6246722164843507 620172791803994\t4693004732956340691
    1573244438690812579  45140890577\t06229429197107928209
    55037687525678773091862  5407449\t69844508330393682126
    183363848 2533015468619612434876768\t1297534375946515
    803862875928 78490201521685554828717\t201219257766954
    78182833757993103614740356856 449095\t527097864797581
    1672632010043689784255353992093183744\t1497806860984
    484030\t9812907779179908821879  5327364475675590848030
    870869\t87551392711854517078544 161852424320693150332
    59959406\t895756536782107074926 966537676326235447210
    69793950\t679652694742597709739 166693763042633987085
    4105268470\t829908521139942736573 4116182760315001271
    6537860736150\t10808570091499395125 57028198746004375
    3582903531743471732\t6932123578154982 629742552737307
    949537597651053059\t469660676831565743 77167401875275
    8890280257173322\t96191  76668713819931811 048770190271
    25267680276078003013678 680992525463401061632866526
    3627021854049\t770558562994  6580636237993140746255962
    2407448690823\t117497779236546  6257246923322810917141
    9143028\t8197103288597806669\t7 60892938638285025333403
    34413065578016127815 21815\t005561868836468420090470
    23053081172816 4304876237919\t69842487255036638784583
    1148769693215490281042402 01383351\t24462181441773470
    6378329949063625966649858761 82212\t25225512486764533
    67720186971698544312419 57240991395\t9008952310058822
    9554825530026352 0781532296796249481641953868218774
    7608532713228572311042 4803456124867\t697064507995236
    37774242535411291684276  86553892620\t5024910326572967
    237019132757256 75285653248258265463092207058596522
    2979886027225  8331913126375147341\t994889534765745501
    184957014548792889  8485682772607\t7713721403798879715
    38298203783031473527721 58\t0348144513491373226651381
    3482954382919991 818027891\t6522431027392251122869539
    4095795306640523 263253804\t4100059654939159879593635
    29746152185502 3713076422\t55121183693803580388584903
    4169811622207297718615823\t6678424689157993532961922
    6246795719440126904387\t710 5048102390895523597457
    2318970677\t25479150615055049 53922979530901129967519
    861880882\t2587 5314529584099251203829 009407770775672
    1130673970830\t4724483816533873502340845647058077308
    82959174767140363198008\t187 129011875491310547126581
    9762333104481838626951545\t6334926366572897563400500
    4284628018351707052 783183\t9425882145521227251250327
    551216035469812005817  6\t21652 12827652751691296897789
    3223819\t573432 9339946437501907836945765883352399886
    75506164965\t1847751807381688378610 91527357929701337
    621778427521926234\t0194239963916  8044983993173312731
    32924185707 147349566 9\t16674687634660915035914677504
    9951867143023 52196 288948901\t02423325116913619626622
    732674608005 915474718307 98  \t92868535206946944540724
    768418225246744171615 14 03642798227\t3348055556214818
    971426179103425986472 0451689398942\t2179826088076852
    87783646182799346 3137677543\t0780936333018982642090
    1084880252167467 08832\t151201858 83543223812876952786
    7132961247 478246 4538\t636993009049310363619763878039
    62184073 5723997942234\t06235393808339651327408011116
    66627891981488087797 941\t876876144230030984490851411
    60661826293682836764744\t779 239180335110989069790714
    85786944089552990 653640\t447 425576083659976645795096
    6602439640990538\t9 607120198 2199760 47599490197230297
    649139826800329\t73156037120 041377903785566085089252
    16730939319872750 275468906 903707539413042652315011
    948093772450487951509541\t00921645863754710598436791
    786391670211874\t92431\t995700 641917969777599028300699
    1536871371193\t661495281130 5876380278410754449733078
    4078992311553\t55625611423 22423255033685442488917353
    448899115014406\t48020  299340368006977710650566631954
    8123488067321\t014673 9058568557934581403627822703280
    82616570773948\t32759 2232845941706525094512325230608
    229188020587\t773197  19839450180888072429661980811197
    77158542502\t016545090413245809786882778948721859617
    7210783843\t506918615 5435 662884062257473692284509516
    208496039801340\t017239 30671666823555245252804609722
    53503534226472\t5242508 74054075591789781264330331690
    """
     
    print 'ch[0:80] =\n',ch[0:80]
    print "\nch[0:80].replace('\\n','') =\n",ch[0:80].replace('\n','')
    print "\n''.join(ch[0:80].split('\\n')) =\n",''.join(ch[0:80].split('\n'))
    print "\nre.sub(r'\n','',ch[0:80]) =\n",re.sub(r'\n','',ch[0:80])
    print '\n--------------------\n'
    from timeit import Timer
    import re
     
    def f(x):
        return x.replace('\n','')
    def g(x):
        return ''.join(x.split('\n'))
    def h(x):
        return re.sub(r'\n','',x)
     
     
     
    iterations = 100000
    tf = Timer('f(ch)','from __main__ import f,ch').timeit(iterations)
    tg = Timer('g(ch)','from __main__ import g,ch').timeit(iterations)
    th = Timer('h(ch)','from __main__ import h,ch').timeit(iterations)
     
     
    print '\nch[0:80] =\n',ch[0:80]
    print "timeit unique d'execution de x.replace('\\n','') :",tf
    print '\nch[0:80] =\n',ch[0:80]
    print "timeit unique d'execution de ''.join(x.split('\\n')) :",tg
    print '\nch[0:80] =\n',ch[0:80]
    print "timeit unique d'execution de re.sub(r'\\n','',x) :",th
     
     
    print '\n-------------------------------\n'
    repet = 12
    litf = Timer('f(ch)','from __main__ import f,ch').repeat(repet,iterations)
    litg = Timer('g(ch)','from __main__ import g,ch').repeat(repet,iterations)
    lith = Timer('h(ch)','from __main__ import h,ch').repeat(repet,iterations)
     
     
    print '\nch[0:80] =\n',ch[0:80]
    print "\ntemps d'execution de x.replace('\\n','') :"
    s = 0
    for y in litf:
        print y
        s = s+y
    print "temps moyen d'execution de x.replace('\\n','') : ",s/repet
     
     
     
    print '\nch[0:80] =\n',ch[0:80]
    print "\ntemps d'execution de ''.join(x.split('\\n')) : "
    s = 0
    for y in litg:
        print y
        s = s+y
    print "temps moyen d'execution de ''.join(x.split('\\n')) : ",s/repet
     
     
     
    print '\nch[0:80] =\n',ch[0:80]
    print "\ntemps d'execution de re.sub(r'\\n','',x) : "
    s = 0
    for y in lith:
        print y
        s = s+y
    print "temps moyen d'execution de re.sub(r'\\n','',x) : ",s/repet

    >>>
    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812

    ch[0:80].replace('\n','') =
    37 1072875339021027987979982208 37590246 5101357402504 637693767749000971264812

    ''.join(ch[0:80].split('\n')) =
    37 1072875339021027987979982208 37590246 5101357402504 637693767749000971264812

    re.sub(r'
    ','',ch[0:80]) =
    37 1072875339021027987979982208 37590246 5101357402504 637693767749000971264812

    --------------------


    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812
    timeit unique d'execution de x.replace('\n','') : 9.01131959509

    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812
    timeit unique d'execution de ''.join(x.split('\n')) : 14.6174508213

    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812
    timeit unique d'execution de re.sub(r'\n','',x) : 22.2610868141

    -------------------------------


    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812

    temps d'execution de x.replace('\n','') :
    8.6659606179
    8.7363793443
    8.68284376925
    8.92423925387
    8.66822179914
    8.68367432174
    8.68264625811
    8.69218378313
    8.87638540653
    8.64747614571
    8.46179919515
    8.44601534553
    temps moyen d'execution de x.replace('\n','') : 8.68065210336

    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812

    temps d'execution de ''.join(x.split('\n')) :
    15.0920225895
    16.9949711486
    15.7121857666
    15.2533254925
    15.2645721733
    15.1035360639
    16.2066849278
    15.684344798
    19.0551910927
    18.9558885277
    18.7616761348
    17.9872888873
    temps moyen d'execution de ''.join(x.split('\n')) : 16.6726406336

    ch[0:80] =
    37 1072875339021027987979982208 37590246 510135740250
    4 637693767749000971264812

    temps d'execution de re.sub(r'\n','',x) :
    24.4568865596
    22.685794703
    22.7501537207
    26.9632956144
    25.6232370315
    23.29087831
    25.6237055268
    24.0778160353
    23.1589771884
    24.9340709504
    22.130466861
    25.8044148069
    temps moyen d'execution de re.sub(r'\n','',x) : 24.2916414423
    >>>
    Sur la base de ces résultats, ''.join(x.split('\n')) est tout de même 92% plus longue que x.replace('\n','').
    Moi je préfère replace() car je trouve qu'intellectuellement x.replace('\n','') est plus immédiat à comprendre que ''.join(x.split('\n')). Il se trouve qu'en plus c'est plus rapide, alors....

    --------
    Quand j'écris
    «- ch.replace() me semble agir sur ch directement sans intermédiaire. »
    je ne prétends pas énoncer une exactitude, c'est pourquoi je dis «me semble». Je cherche à dire en peu de mots l'idée que j'ai dont ça fonctionne: ça prend la chaine ch et ça en déduit directement le résultat. C'est vrai que j'aurais dû écrire «agir à partir de ch directement» au lieu de «sur».

    --------------------
    Bravo dividee.
    Je n'avais pas compris translate() jusqu'à présent. Il me manquait maketrans().
    Ça risque d'être très très utile. Si en plus c'est très rapide, c'est super à connaître.

  6. #6
    Membre Expert
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    1 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 1 418
    Par défaut Attention à translate()
    translate() est plus rapide que replace() quand il y a plusieurs caractères à éliminer:

    temps moyen d'execution de
    x.replace('\n','').replace('\t','').replace(' ','') : 2.46409529703

    temps moyen d'execution de ''.join(x.split()) : 8.99861174162

    temps moyen d'execution de re.sub(r'\n|\t| ','',x) : 19.7118446385

    temps moyen d'execution de translate(tbl,'\n\t ') : 0.889644214558
    Mais c'est replace() la plus rapide s'il n'y a qu'un caractère à éliminer:

    temps moyen d'execution de x.replace('\n','') : 0.769087062741

    temps moyen d'execution de ''.join(x.split('\n')) : 1.362719354

    temps moyen d'execution de re.sub(r'\n','',x) : 1.99931080626

    temps moyen d'execution de x.translate(tbl, '\n') : 0.828341660742
    Mesures de temps effectuées avec iterations = 100000 et repet = 12

Discussions similaires

  1. SORT - Question JOIN/Comparaison 2 fichiers
    Par Metalman dans le forum JCL - SORT
    Réponses: 3
    Dernier message: 13/03/2014, 08h57
  2. [XL-2010] Split cellule avec ; puis comparaison à un intervalle de toutes ces valeurs
    Par vb_noob dans le forum Macros et VBA Excel
    Réponses: 8
    Dernier message: 18/02/2014, 13h20
  3. Réponses: 6
    Dernier message: 07/05/2012, 18h19
  4. substition vs split-join
    Par Jasmine80 dans le forum Langage
    Réponses: 4
    Dernier message: 06/12/2008, 17h02
  5. caractéres spéciaux, fonction split, replace
    Par clochardevobsy dans le forum VB 6 et antérieur
    Réponses: 4
    Dernier message: 22/10/2005, 23h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo