Fonctions utiles au traitement des chaines caracteres
Bonjour,
Je cherche à extraire des données d'une page html, afin de remplir des cellules d'un tableau.
J'ai besoin pour cela de trouver des mots, ou des nombres placés entre tel et tel mots ou caractères.
Un excellent blog (puis-je le mettre en lien?) explique simplement et en français comment utiliser les fonctions dérivées de string, mais subsistent bien des interrogations concernant : sub, gsub, grep, match, regexpr, strsplit.
Pourriez-vous m'expliquer et poster un exemple commenté par fonction?
Merci beaucoup par avance, je ne trouve rien de vraiment explicite ailleurs.
++
voici le bout de code source
voici le bout de code source. une fois la fonction précédente appliquée, il reste de larges espaces vides sur plusieurs lignes.
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115
|
<a id="aujourdhuiLink" href="/_d2012-08-29?">
Aujourd'hui</a>
<a id="demainLink" href="/_d2012-08-30?">
Demain</a>
</div>
<script type="text/javascript">
var bLinkCalendrier = new YAHOO.widget.Button("selectedDateLink");
YAHOO.util.Event.onContentReady("grtdes", function (){
var bLinkHier = new YAHOO.widget.Button("hierLink");
var bLinkAujourdhui = new YAHOO.widget.Button("aujourdhuiLink");
var bLinkDemain = new YAHOO.widget.Button("demainLink");
});
</script>
<input type="hidden" id="selectedDateValue" value="16/08/2012">
<div id="calContainer" style="display:none;"></div>
</div></div>
</div> <div class="yui-gc cartouche">
<BR>
<!-- nom qsdf -->
<div class="yui-u first nom">
jeudi :
n (x)
</div>
<!-- liens -->
<div class="yui-u">
<div class="lien">
x | <a href="/2012-08-16_d2012-08-16#y">
fds</a>
| <a href="/2012-08-16_d2012-08-16#y">
L'Aers</a>
| <a href="/ys-iop-poi/2012-08-16_d2012-08-16#y">
s</a>
| <a href="/ys-iop-poi/2012-08-16_d2012-08-16#y">
oy</a>
| <a href="/ys-iop-poi/2012-08-16_d2012-08-16#y">
Ds</a>
</div>
</div>
<!-- f grt -->
<div class="yui-u first nomgrt">
<span class="TQQ">
<strong>
1<sup>ère</sup> grt -
jklm dfd Ge</strong>
</span>
</div>
<!-- INSCRIPTION -->
<div class="yui-u INSCRIPTION s">
<!-- liens vers les autres iopqsdf -->
<span class="ndzqerogrt fond">1</span>
<a href="/2012-08-16-gfdqgrg-poi-jklms_c459408" accesskey="2">
<span class="numerogrt ">2</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklme_c459409" accesskey="3">
<span class="numerogrt ">3</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklms_c459410" accesskey="4">
<span class="numerogrt M">4</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklm-ma_c459411" accesskey="5">
<span class="numerogrt M">5</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklm-t_c459412" accesskey="6">
<span class="numerogrt ">6</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklm-as_c459413" accesskey="7">
<span class="numerogrt ">7</span>
</a>
<a href="/2012-08-16-gfdqgrg-poi-jklm-l_c459414" accesskey="8">
<span class="numerogrt ">8</span>
</a>
<br>
<!-- pictos fresdfr -->
<img src="/web/images/pictos/azerty/1_01.gif" alt="f">
<img src="/web/images/pictos/azerty/01.gif" alt="fer">
<img src="/web/images/pictos/azerty/21.gif" alt="sdf">
<img src="/web/images/pictos/azerty/31.gif" alt="zerdfs">
<img src="/web/images/pictos/azerty/41.gif" alt="fezqfef">
</div>
<BR>
<!-- qdsgr -->
<span class="infogrt">
Départ <strong>13h50</strong>
<br><br>type
- info
- info
- info;
- 2875m
- 9999 info
- info
- info : info<br>
<span class="conditiongrt">info</span><br>
</span>
<br>
<!-- info -->
</div><script type="text/javascript">
fillWithRows = function(id, n) {
var tr = document.getElementById(id);
var fsdf = document.getElementById('dfs');
if(id == 'sdfdsf' && null == dsfsdsf) {
n+=3;
}
if(null != tr) {
tr.firstChild.height = (n * 20) + 'fd';
}
}
</script>
<script type="text/javascript" src="http://banzai.dfs.com/web/sdfdfsdf_sdfdf7.js"></script> |