
|
#include <algorithm>
#include <sstream>
#include <set>
#include <map>
#include <string>
#include <fstream>
#include <iterator>
#include <iostream>
using namespace std;
// Outil de traitement de mots qui retire les séparateurs
struct RetireSeparateurs
{
string Traiter( string const & mot, string const & separateurs ) const
{
string motRetour( mot );
// Pour chaque lettre du mot
for ( size_t i = 0; i < motRetour.size(); ++i )
{
// La lettre est un séparateur
if ( separateurs.find( motRetour[i] ) != string::npos )
{
motRetour.erase( i );
--i;
}
}
return motRetour;
}
};
// Prédicat indiquant si un mot répond au critère : plus de trois caractère
struct PlusDeTroisCaracteres
{
bool Verifier( string const & mot ) const
{
return mot.size() > 3;
}
};
// Foncteur qui, à partir d'un mot, remplit la map et le set
template <typename TRAITEMENT,
typename CRITEREAJOUT>
struct Remplir
{
Remplir( map<string, int> & tousLesMots,
set<string> & doublons,
string const & sep )
: m_map( tousLesMots ),
m_set( doublons ),
m_sep( sep ),
m_pos( 0 )
{
}
template <typename T>
void operator() ( T const & constmot )
{
// Obtient un nouveau mot débarassé des séparateurs
string mot( TRAITEMENT().Traiter( constmot, m_sep ) );
// Un séparateur isolé ?
if ( mot.empty() )
return;
// Le mot est bien réél, on incrémente la position
++m_pos;
// Le mot répond-t-il aux critères ?
if ( !CRITEREAJOUT().Verifier( mot ) )
return;
// Le mot existe-t-il déjà ?
if ( m_map.find( mot ) != m_map.end() )
// Un doublon détecté
m_set.insert( mot );
else
// Un nouveau mot, on stocke sa position
m_map[ mot ] = m_pos;
}
private:
map<string, int> & m_map;
set<string> & m_set;
string const & m_sep;
int m_pos;
};
// Foncteur qui supprime un mot d'une map
struct Supprimer
{
Supprimer( map<string, int> & tousLesMots )
: m_map( tousLesMots )
{
}
template <typename T>
void operator() ( T const & mot ) const
{
m_map.erase( mot );
}
private:
map<string, int> & m_map;
};
int main(int argc, char *argv[1])
{
// Ouverture du bon fichier
ifstream file;
file.open(argv[1], ios::in);
// Map qui va au FINAL contenir les mots uniques
// de plus de 3 carac avec leur position
map<string, int> motsUniques;
// Set intermédiaire des mots doublons
// Sert à retirer (après coup) les doublons de la map
set<string> doublons;
// Chaine contenant les caractère a ne pas prendre en compte
// On pourrait plutot utiliser un Set pour plus de rapidité
string separateurs("()[].,'");
// Itere chaque "mot" du fichier
// (séparés par des espaces ou des sauts de ligne)
// Insère les mots dans la map selon un critère
// après traitement préalable et trouve les doublons
for_each( istream_iterator<string>(file), istream_iterator<string>(),
Remplir<RetireSeparateurs,PlusDeTroisCaracteres>( motsUniques, doublons, separateurs ) );
// Supprime de la map les doublons contenus dans le Set
for_each( doublons.begin(), doublons.end(),
Supprimer( motsUniques ) );
// Ecriture du résultat
ofstream outfile;
outfile.open( "D:\\Projet2008\\Dev-Cpp\\Projet\\out.txt" , ios::out);
for ( map<string, int>::iterator it = motsUniques.begin(); it != motsUniques.end(); ++it )
outfile << it->first << " " << it->second << endl;
return 0;
} |
Partager