Bonjour,
Dans le cadre d’une étude bibliométrique je cherche a récupérer des informations concernant des articles scientifiques contenues dans des emails. Je dois traiter environ 30 000 emails et c’est pourquoi je cherche à automatiser les traitements.

J’ai simplement exporté mes emails de outlook 2003 vers Access 2003.

Chaque email contient dans son corps des informations structurées comme ci-dessous :
------------------------------------------------------------------------------------------------------------
Donnée: 2

Titre:
`Multitrack' Your Way To The Top.

Auteurs:
Lewis, Brian J.

Source:
Journal of Management in Engineering; May/Jun99, Vol. 15 Issue 3, p8, 2p

Type de document:
Article

Termes du sujet:
*JOB hunting
*EMPLOYMENT (Economic theory)

Résumé:
Focuses on mutitrackers, employees with multiple job experience. Effect
of globalization on employees; Key reaching the top; How search firms
value job positions.

ISSN:
0742-597X

Numéro d'accs:
1836791

Lien permanent vers cet enregistrement (permalien):
http://search.ebscohost.com/login.as...AN=1836791&amp
;lang=fr&site=ehost-live
Couper et coller : <A
href="http://search.ebscohost.com/login.aspx?direct=true&db=bth&AN=18367
91&amp;lang=fr&site=ehost-live">`Multitrack' Your Way To The Top.</A>

Base de données:
Business Source Complete
Les informations de lien ci-dessus proposent un lien permanent à
l'article que vous avez demandé.

Lien permanent à cette donnée : cliquez sur le lien ci-dessus pour aller
au début de l'article ou de la citation.

Couper et coller : pour placer les liens d'articles dans un document Web
externe, il suffit de copier et coller le code HTML ci-dessus, à partir
de la balise « <A HREF »

En cas de problème ou si vous avez des questions, contactez l'Assistance
technique à l'adresse http://support.epnet.com/contact/askus.php ou
appelez le 800-758-5995.

Cet e-mail a été généré par un utilisateur d'EBSCOhost ayant accès au
compte ESC LILLE . Ni EBSCO ni ESC LILLE ne sont responsables du contenu
de cet e-mail.
-----------------------------------------------------------------------------------------------------------------
je cherche a récuperer dans une table les informations :

Donnée :
Titre :
Auteur :
Source :
……

J’ai fait des essais à partir de l’editeur de requête d’access en utilisant les fonctions
DansChaine pour trouver la position des mots balise comme Titre: et Auteur:
Puis la fonction ExtracChaîne
L’ensemble du message se trouvant dans le champ [Corps]

Cela donne par exemple pour extraire la valeur de Auteur

PosAuteur: DansChaîne(SupprEspace([Corps]);"Auteurs:")+8

PosSource: DansChaîne(SupprEspace([Corps]);"Source:")-2

Auteur: SupprEspace(ExtracChaîne([Corps];[PosAuteur];[PosSource]))

Je pensais construire ainsi la décomposition du champs corps et grâce a une requête mise a jour, remplir une table avec les valeurs intéressantes pour les traitements ultérieurs à faire sur ces données. Le resultat que j’obtiens n’est cependant pas probant, puisque dans cette j’obtiens pour

PosAuteur : 69
PosSource : 99
Auteur :

Lewis, Brian J.

Source:
Journal of Management in Engineering; May/Jun99, Vol. 15 I

Quelqu’un saurait t il m’expliquer mon erreur de raisonnement ?
Quelqu’un aurait t il une approche plus efficace de l’extraction de ces données.

Merci d’avance de votre aide.
Charles