RE
Bizarre
Je viens de mettre 2019 à jour et pas de pdf proposé dans la liste mais il traite bien le fichier...
A priori tu as aussi le bon traitement sur 2016 ?
RE
Bizarre
Je viens de mettre 2019 à jour et pas de pdf proposé dans la liste mais il traite bien le fichier...
A priori tu as aussi le bon traitement sur 2016 ?
Chris
PowerQuery existe depuis plus de 13 ans, est totalement intégré à Excel 2016 &+. Utilisez-le !
Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson.
Confucius
----------------------------------------------------------------------------------------------
En cas de résolution, n'hésitez pas cliquer sur c'est toujours apprécié...
oui j'ai aussi le bon traitement sur 2016. En effet sous Excel 2016 et 2019 je n'ai pas le PDF proposé dans la liste du A partir d'autres sources, c'est pour cela que je croyais que l'on ne pouvait pas utiliser un PDF comme source dans Excel 2016 et Excel 2019.
En effet dans les exigences d'installation de Power Query il y a :
Système d'exploitation pris en charge
Windows 10; Windows Server 2008 R2; Windows Server 2012; Windows 7; Windows 8
- Windows Server 2008 R2
- Windows Server 2012
- Windows 7
- Windows 8
- Windows 8.1
Les versions d'Office suivantes sont prises en charge :
- Microsoft Office 2010 Professional Plus avec Software Assurance
- Microsoft Office 2013
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
Chris
PowerQuery existe depuis plus de 13 ans, est totalement intégré à Excel 2016 &+. Utilisez-le !
Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson.
Confucius
----------------------------------------------------------------------------------------------
En cas de résolution, n'hésitez pas cliquer sur c'est toujours apprécié...
Bonjour,
J'ai reçu un mail standard du site m'indiquant qu'une réponse a été posté provenant de JP mais je ne la vois pas dans la discussion..
En postant ce message je vois tes messages JP
A priori il y a eu du ménage dans cette discussion. - autant pour moi on a changé de page!!!
J'ai installé la version 2019 et je n'ai pas la possibilité d'importer à partir d'un pdf
Dans vos réponses vous indiquez "mais il traite bien le fichier"
Comment fait-on ?
merci
Hello,
Pour pouvoir importer des données PDF avec la version 2019 il faut utiliser du code Power Query M . C'est ce que fait 78chris dans son classeur PDF_PQ4.xlsx du message #12
Dans Excel 2019
1 - Ouvrir ce classeur,
2 - Aller dans la feuille Choix pour mettre le bon chemin du fichier PDF source.
3 - Pour voir les requêtes Power M. dans le ruban , cliquer sur Données/Requêtes et connexions.
4 - Dans le volet qui s'ouvre il y a 4 requêtes :
- la première Typologie est celle qui extrait les tables du fichier PDF, les 3 autres extraient les données des différents événements pour les mettre dans les feuilles adéquates.
Ami calmant, J.P
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
1 PDF_PQ4.xlsx ?
2 je n'ai pas "Choix" comment le faire apparaitre ?
C'est bon j'ai vu choix en bas de la feuille
c'est louche :
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
Je pensais que "Choix" était une fonctions d'Excel donc dans le bandeau.
J'ai vu les 3 tableaux qu'à fait Chris
Comment je fais pour analyser un autre fichier pdf
Si je récupère une version 2021, aurais-je la solution simple "obtenir des données" "à partir d'un fichier PDF"
Car vous vous êtes dans votre élément, mais moi je rame...
Bonjour
Modifier la cellule en jaune puis Données, Actualiser tout
Si le fichier pdf a bien la même structure cela devrait remplacer les données des onglets Mariages, Baptêmes et Décès par celle du nouveau fichier
Chris
PowerQuery existe depuis plus de 13 ans, est totalement intégré à Excel 2016 &+. Utilisez-le !
Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson.
Confucius
----------------------------------------------------------------------------------------------
En cas de résolution, n'hésitez pas cliquer sur c'est toujours apprécié...
Bonjour Chris,
Cela mouline quelques secondes et je retrouve un onglet mariages vide et les onglets baptêmes et décès avec les données de Mametz - ville avec laquelle tu as mis au point ta solution.
2 messages identiques apparaissent en fin traitement parlant de colonne9 non trouvé (ou message approchant)
Je te joins le fichier Excel, le PDF de la nouvelle ville que je fais mouliner (Laires) ainsi que le PDF de Mametz (si jamais tu l'as supprimé de ton ordi)
Pour Mametz c'est parfait car tu as résolu pour les baptêmes le(s) prénoms(s) du père
J'ai installé office 2021 et la conversion PDF vers Excel est nulle
Cdlt
pour les baptêmes: il y a 2 problèmes identifiés pour l'instant
le dernier chiffre de l'année est omis
pour les 155 premières lignes (noms commençant par A B C) le prénom du père est absent uniquement à la ligne 76 BUCHEZ Marie Marguerite.
pour ceux qui sont erronés le(s) prénom(s) du père est affecté à son enfant
Pour les décès
l'âge (parfois non renseigné) dans le PDF est absent aux lignes 3/14/27/48 - l'âge est décalé dans le PDF pour les 4.
mais ce n'est pas systématique, il est parfois bon dans Excel bien que décalé dans le PDF.
j'ai analysé les lignes 2 à 50 du fichier Excel
Bonjour
La structure du second fichier apparait un peu différent, ce qui ne donne rien en Typologie et fait ensuite planter les 3 requêtes qui en dépendent.
En modifiant un peu on arrive à ce que la typologie fonctionne pour une ville et pour l'autre.
Pour les mariages j'arrive aussi à ce que les 2 fichiers soient traités mais le second fichier n'a plus le même repère pour trouver la fin de la table donc on récupère des lignes au delà de la table qu'il faudrait ensuite supprimer
Pour les baptêmes dans le 1er fichier un espacement plus important entre les prénoms de l'enfant et ceux du père et entre les prénoms du père et ceux de la mère était présent, ce qui permettait dans la majorité des cas de trouver le point de coupe. Là un espace simple partout donc pas gérable. En compliquant au mieux on trouvera la mère...
Pour les décès dans le 1er, cela des sépultures dans le second et les alignements sont encore plus aléatoires donc de moins en moins faisable.
Pas bien compris si le message de 16h41 s'adresse aussi à moi.
Avoir un 3ème fichier on pourrait voir si on a au moins correctement les mariages...
Je joins le fichier modifié qui semble OK sur les mariages dans les 2 cas (sauf la fin à supprimer pour le second).
Chris
PowerQuery existe depuis plus de 13 ans, est totalement intégré à Excel 2016 &+. Utilisez-le !
Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson.
Confucius
----------------------------------------------------------------------------------------------
En cas de résolution, n'hésitez pas cliquer sur c'est toujours apprécié...
hello,
dans le deuxième PDF il est préférable de travailler sur les tables du PDF plutôt que sur les pages car il s'agit de véritables tables PDF pour les données qui nous intéressent (A la fin du PDF dans le sommaire on voit bien qu'il y a des tables).
Haltero2 est-ce que tu as beaucoup de structures de fichiers source PDF différentes car il devient impossible de faire des requêtes Power Query M compatibles avec toutes les structures de fichier source ou alors cela devient une usine à gaz ? Il est préférable de faire des requêtes pour chaque type de structure mais dans ce cas si tu as beaucoup de types de structure différentes on ne va pas plus pouvoir t'aider car cela demande trop de temps.
Ami calmant, J.P
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
Bonjour,
réponse pour Chris et JP
Je comprends la réflexion de JP concernant le temps à investir de votre part et une automatisation quasi individuelle pour chaque PDF.
il y une quinzaine de PDF ayant VISUELLEMENT la même apparence mais il est difficile pour moi de savoir s'il s'agit de véritables tables ou toutes autres structures.
il y en a une dizaine d'autres ayant des formatages nettement différentes des 15 précitées et toutes un peu différentes l'une de l'autre.
Les 2 que je vous ai fourni jusqu'à présent me semblaient identiques.
Ma priorité portent sur les mariages où on y trouvent les les noms, prénoms, âges, profession des mariés et leurs parents - c'est théorique car malheureusement toutes ces infos ne sont pas toujours présentes (mais cela répond à une question de Chris sur mon intérêt sur les mariages).
Mais il ne faut pas chercher à être exhaustif dans les résultats.
Si on prend les décès (ma réponse d'hier vers 16h00 sur les naissance et décès s'adresse bien à toi Chris) si il y a une colonne supplémentaire avec l'âge par ce que décalé sur le PDF n'est pas un problème, je les corrigerai à la main.
Le vrai problème est de ne pas retrouver des données dans le fichier Excel alors qu'elles sont dans le PDF.
La solution de JP pour les mariages (Notepad++,txt) est suffisante.
Pour les décès si Chris arrive à régler la date (je ne pense pas que ce soit le + difficile) et mettre l'âge dans une colonne (la bonne c'est parfait - une colonne à côté où j'interviendra manuellement c'est quasi parfait).
Restent les naissances.
Peu importe la suite donnée à cette discussion, je vous remercie tous les deux pour le temps que vous avait déjà passé et peut-être le temps que vous passerai encore.
Cordialement
J'ai mis 5 PDF qui se distinguent plus au moins des deux déjà envoyés (BMS 1=Mametz et 13=Laires) (tous les fichiers sont numérotés de BMS 1 à BMS 22).
Le bon fichier est NEW…., l'autre fichier RAR est à supprimer mais je pense que je ne peux pas le faire à mon niveau
A noter que j'ai fait les mariages par la solution de JP pour les BMS 1 à 7 (il y en d'autres mais ne m'intéresse pas à priori)
Les BMS 10,11,12 ressemblent à la BMS 13 sauf qu'il y a deux communes par fichier (structure table PDF).
Les BMS 17,18,20 semblent incomplets ( il n' y a pas toujours toutes les tables)
Les fichiers semblent avoir des tables PDF donc extraction possible en indiquant en paramètres la page de début et la page de fin des différentes tables.
Les BMS 17 à 20 ont des structures de table différentes des BMS 10 à 13 (date éclatée par exemple).
Pour l'instant tu n'as pas le code Power Query M pour extraire les PDF par table.
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
pour JP
Je regarderai ton message 38 à mon retour (dentiste!!!).
je viens de trouver un bug dans ta macro.
En extrayant les mariages de BMS 1 MAMETZ, il manque 7 lignes qui correspondent à 7 lignes du nom accentué GORRÈ dans le PDF
c'est bizarre il n'y a pas de GORRÈ ( Grouik grouik ! ) dans le BMS 1 que des GOZÈ qui eux passent. Et j'ai le bon nombre de lignes par rapport au fichier source. Attention j'avais modifié mon script VBA justement pour prendre en compte le È dans le regex, peut-être as-tu une mauvaise version.
Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager