Bonjour,

Je cherche un coup de main en algorithmique afin de trouver une structure de donné pour un échange entre une API Node.JS et PHP.

Ma structure de donné doit intégrer différentes valeurs :
  • l'url de la page parsée,
  • le sélecteur utilisé et/ou la regex utilisé
  • les résultats obtenues.


sachant que ces résultats peuvent être mis en forme de différentes façons afin d'optimiser le débit réseau, la manipulabilité de la structure de donnée et son stockage.

Exemple :

En recherchant les balises "meta" sur ma page html et en appliquant la regex sur le résultat ("/og:/g") j'obtient la sortie suivante :


Code HTML : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
<meta data-react-helmet="true" property="og:description" content="Unreal Engine is the world’s most open and advanced real-time 3D creation platform for photoreal visuals and immersive experiences.">
<meta data-react-helmet="true" property="og:title" content="Unreal Engine | The most powerful real-time 3D creation platform">
<meta data-react-helmet="true" property="og:type" content="website">
<meta data-react-helmet="true" property="og:image" content="https://cdn2.unrealengine.com/new-logo-share-1400x788-03-1400x788-c9d09f067a09.jpg">
<meta data-react-helmet="true" property="og:locale" content="en-US">
<meta data-react-helmet="true" property="og:url" content="https://www.unrealengine.com/en-US/">
<meta data-react-helmet="true" property="og:site_name" content="Unreal Engine">
<meta data-react-helmet="true" property="og:type" content="article">

J'obtient bien tous les open-graphs contenus dans les balises "meta".

Ce que je cherche à faire:

  1. Décider de ce que je garde dans les balises que j'ai récupérée
    • Je peut récupérer tous les attributs des balises "meta" type "data-helmet, etc..." et leurs valeurs dans un couple clef/valeur.
    • Ne garder que les valeurs dont j'ai besoin (en l'occurrence celle de de "property" et de "content" dans un tableau clef valeur à condition que je trouve le moyen de parser mon résultat d'une façon adéquate --besoin d'aide ici)
    • Garder toute la balise "meta" plus ou moins en l'état
  2. Décider de la façon de structurer mes données dans une optique d': optimisation de la taille et de manipulabilité de la structure (--besoin d'aide ici) :
    • choix de la structure de stockage :
      • tableau =>multidimensionnel /unidimensionnel, ordre et position des index, etc...
      • json
      • xml
      • nodelist...etc
    • facilité de lecture/écriture