1 2 3 4 5 6
| >>> import re
>>> from collections import Counter
>>> s = 'IOXIYNBMIAWBCNKGDNBYLERLVAKLUKNHNBYRKBDWKCNCKDQNHIBONLXNKGANERAKANBYEANLCNOKILRBLUKIODWHEAIYCRMRBYRFNDWHHNBYIOLVAKORINBYLIQRKYCRBLONDINOHWAYERANIOLRCNLOKBNLXKHNKLNLHRILRKARLCKLWOKBRKYANLENDYRDONMNBRIYCNORAANYNA'
>>> z = re.findall(r'(?=(..))', s) # les digrammes de la chaine (on capture *dans* le lookahead)
>>> dict(Counter(z)) # le comptage via Counter()
{'IO': 4, 'OX': 1, 'XI': 1, 'IY': 3, 'YN': 2, 'NB': 7, 'BM': 1, 'MI': 1, 'IA': 1, 'AW': 1, 'WB': 1, 'BC': 1, 'CN': 5, 'NK': 3, 'KG': 2, 'GD': 1, 'DN': 1, 'BY': 6, 'YL': 2, 'LE': 2, 'ER': 3, 'RL': 2, 'LV': 2, 'VA': 2, 'AK': 3, 'KL': 3, 'LU': 2, 'UK': 2, 'KN': 1, 'NH': 2, 'HN': 3, 'YR': 3, 'RK': 4, 'KB': 3, 'BD': 1, 'DW': 3, 'WK': 1, 'KC': 1, 'NC': 1, 'CK': 2, 'KD': 1, 'DQ': 1, 'QN': 1, 'HI': 1, 'IB': 1, 'BO': 1, 'ON': 3, 'NL': 6, 'LX': 2, 'XN': 1, 'GA': 1, 'AN': 6, 'NE': 1, 'RA': 3, 'KA': 2, 'YE': 2, 'EA': 2, 'LC': 2, 'NO': 3, 'OK': 3, 'KI': 2, 'IL': 2, 'LR': 3, 'RB': 3, 'BL': 2, 'OD': 1, 'WH': 2, 'HE': 1, 'AI': 1, 'YC': 3, 'CR': 2, 'RM': 1, 'MR': 1, 'RF': 1, 'FN': 1, 'ND': 3, 'HH': 1, 'YI': 1, 'OL': 2, 'KO': 1, 'OR': 2, 'RI': 3, 'IN': 2, 'LI': 1, 'IQ': 1, 'QR': 1, 'KY': 2, 'LO': 2, 'DI': 1, 'OH': 1, 'HW': 1, 'WA': 1, 'AY': 1, 'NI': 1, 'RC': 1, 'BN': 1, 'XK': 1, 'KH': 1, 'LN': 1, 'LH': 1, 'HR': 1, 'AR': 1, 'LW': 1, 'WO': 1, 'BR': 2, 'YA': 1, 'EN': 1, 'DY': 1, 'RD': 1, 'DO': 1, 'NM': 1, 'MN': 1, 'AA': 1, 'NY': 1, 'NA': 1} |
Partager