salut j'ai un fichier log sous format texte que dois importer dans une base de donnée graphique qui est NEO4j pour l'analyser ensuite.
voici un morceau du fichier
1394950584.861 438 10.0.149.23 TCP_MISS/200 934 GET http://dzayfdqe.trwvksnpc.au/lsetyumxs.html - DIRECT/69.114.1.230 text/html
1394950629.431 580 10.0.149.23 TCP_MISS/200 922 GET http://oacsyus.jxjsaz.tz/znvr.html - DIRECT/79.179.220.28 text/html
1394950629.862 460 10.0.149.23 TCP_MISS/200 1860 GET http://jfgmbt.pfkaa.cat/ogwblsah.html - DIRECT/219.135.237.57 text/html
1394950632.629 849 10.0.149.23 TCP_MISS/200 607 GET http://qpslzh.ngqde.construction/yhhbzllx.html - DIRECT/202.34.56.241 text/html
1394950633.244 916 10.0.149.23 TCP_MISS/200 1651 GET http://psficabij.hklrmkfm.mv/vqjfld.html - DIRECT/154.252.249.81 text/html
1394950633.687 906 10.0.149.23 TCP_MISS/200 182 GET http://weiovu.vlscqtzwh.sz/mltwecfgg.html - DIRECT/176.245.255.69 text/html
1394950636.311 678 10.0.149.23 TCP_MISS/200 1839 GET http://iwcrr.nfveakyas.mp/ayusm.html - DIRECT/152.85.2.88 text/html
1394950637.326 796 10.0.149.23 TCP_MISS/200 839 GET http://tjaxzxte.nezx.si/cdanrah.html - DIRECT/206.212.236.201 text/html
1394950638.331 442 10.0.149.23 TCP_MISS/200 1690 GET http://zaintgwh.anad.mp/xfzoxmja.html - DIRECT/188.143.69.63 text/html
1394950810.137 240 10.0.149.23 TCP_MISS/200 926 GET http://hocmfdpx.zbfewol.bi/acsjacov.html - DIRECT/241.65.133.239 text/html
1394950812.579 627 10.0.149.23 TCP_MISS/200 790 GET http://ehcdjy.mvvwhni.pl/tgah.html - DIRECT/42.128.50.118 text/html
1394950813.692 852 10.0.149.23 TCP_MISS/200 731 GET http://itptjrxy.ymfjgrx.bf/qyopl.html - DIRECT/111.104.20.151 text/html
pour ce faire, je dois couper chaque ligne en des champs je dois faire ceci à travers JAVA qui doit se connecter à la base NEO4j pour faire l'import
j'ai pensé à une expression régulière qui coupe chaque ligne et le résultat sera chaque champ constitue un noeud dans Neo4j
svp aidez moi à trouver une solution
Partager