Précédent   Forum des professionnels en informatique > Autres langages > Autres langages > Ruby
Ruby Le forum sur la programmation Ruby. Voir aussi la FAQ Ruby et les cours Ruby.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 01/12/2011, 10h21   #1
Invité de passage
 
Ph Lam
Inscription : décembre 2009
Messages : 25
Détails du profil
Informations personnelles :
Nom : Ph Lam

Informations forums :
Inscription : décembre 2009
Messages : 25
Points : 4
Points : 4
Par défaut Conversion fichier pdf -> txt (Newbie)

Bonjour,

J'ai un répertoire de plusieurs fichiers pdf que je dois transformer en txt pour ensuite faire un traitement sémantique. Je voudrais que le programme traite le *.pdf avec la librairie pdf-reader, récupère le texte et l'enregistre dans un nouveau fichier qui a le même nom que celui en pdf. J'ai écrit ça mais ça ne fonctionne pas. Pouvez-vous me dire où ça cloche ?
Merci
Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
require 'pdf/reader'
 
Dir.glob('C://pathname/*.pdf') do |item|
 
reader = PDF::Reader.new("C://pathname/#{item}")
 
reader.pages.each do |page|
  for i in page do
  file = File::new("*.txt",'w+')
  puts page.text
  file.close
i=+1
end
end
end
phlam est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/12/2011, 11h23   #2
Membre émérite
 
Avatar de rurouni alex
 
Inscription : juin 2003
Messages : 570
Détails du profil
Informations personnelles :
Âge : 29

Informations forums :
Inscription : juin 2003
Messages : 570
Points : 931
Points : 931
- le nom du fichier txt => remplacer "*.txt" par "#{item}_page#{i}.txt" (par exemple)
- le puts écrit la chaîne sur la sortie standard => remplacer puts page.text par file.write(page.text)
__________________
"Je suis incapable d'expliquer ce qui se passa ensuite : je lâchai quelque chose, quelque chose à quoi je m'agrippais depuis toujours sans m'en rendre compte. Je m'enfonçais dans une obscurité chaude, moelleuse et protectrice, tandis qu'un loup montait la garde par mes propres yeux."
rurouni alex est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/12/2011, 16h08   #3
Invité de passage
 
Ph Lam
Inscription : décembre 2009
Messages : 25
Détails du profil
Informations personnelles :
Nom : Ph Lam

Informations forums :
Inscription : décembre 2009
Messages : 25
Points : 4
Points : 4
Par défaut erreur

Merci pour cette réponse. Cependant, malgré les modifs, j'ai un message d'erreur. Je précise que j'utilise Aptana Studio. Voici le message :
Code :
1
2
3
4
5
6
7
from c:/Ruby192/lib/ruby/gems/1.9.1/gems/pdf-reader-1.0.0.beta1/lib/pdf/reader/object_hash.rb:42:in `initialize'
	from c:/Ruby192/lib/ruby/gems/1.9.1/gems/pdf-reader-1.0.0.beta1/lib/pdf/reader.rb:116:in `new'
	from c:/Ruby192/lib/ruby/gems/1.9.1/gems/pdf-reader-1.0.0.beta1/lib/pdf/reader.rb:116:in `initialize'
	from C:/Documents and Settings/Phlam/My Documents/Aptana Studio 3 Workspace/WebScrappingAnemone/Docsplit.rb:9:in `new'
	from C:/Documents and Settings/Phlam/My Documents/Aptana Studio 3 Workspace/WebScrappingAnemone/Docsplit.rb:9:in `block in <main>'
	from C:/Documents and Settings/Phlam/My Documents/Aptana Studio 3 Workspace/WebScrappingAnemone/Docsplit.rb:8:in `glob'
	from C:/Documents and Settings/Phlam/My Documents/Aptana Studio 3 Workspace/WebScrappingAnemone/Docsplit.rb:8:in `<main>'
Je ne vois pas du tout où est l'erreur....
phlam est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/12/2011, 21h54   #4
Membre émérite
 
Avatar de rurouni alex
 
Inscription : juin 2003
Messages : 570
Détails du profil
Informations personnelles :
Âge : 29

Informations forums :
Inscription : juin 2003
Messages : 570
Points : 931
Points : 931
Ça c'est un problème qui vient de la gem.
Malheureusement, je ne peux actuellement pas chercher + en détails, désolé.
Il faudrait que tu ailles voir sur son site si d'autres utilisateurs n'ont pas le même problème (surtout que c'est une bêta que tu utilises) ou installer une version moins récente.
__________________
"Je suis incapable d'expliquer ce qui se passa ensuite : je lâchai quelque chose, quelque chose à quoi je m'agrippais depuis toujours sans m'en rendre compte. Je m'enfonçais dans une obscurité chaude, moelleuse et protectrice, tandis qu'un loup montait la garde par mes propres yeux."
rurouni alex est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 19h37.


 
 
 
 
Partenaires

Hébergement Web