OpenSource - Nivellement par le bas ?

**pirus** · 23/07/2006, 20h26

[Note aux modérateurs: Ce post aurait sans doute eu sa place ailleurs, mais il semble que je ne puisse pas encore poster dans "Les Débats du Développement". Quoiqu'il en soit, n'hésitez pas à flinguer sans pitié si vous le jugez trop long ou sans d'intéret. Merci.]

Bonjour à tous,

j'aurais sans doute pu intituler ce post "Combustible polémique", mais mon but ici n'est pas de provoquer de réactions violentes ni de revendiquer de positions extrêmes. Je tiens d'ailleurs à préciser que je me considère comme un développeur sensible aux avantages des solutions OpenSource (quelqu'en soit la licence, GPL, BSD, Netscape, etc..). Par ailleurs, ce texte comportant quelques exemples issus de mon expérience personnelle, je vous prierais de bien vouloir les considérer comme de simples illustrations de mes propos, et de ne pas tomber dans le piège qui consisterait à croire que je cherche à imposer à la communauté de ce site mon opinion sur tel ou tel produit, librairie ou méthode de travail (ce qui serait ridicule de ma part).

Il y a quelques mois, j'ai eu à développer une application reposant sur l'analyse de code HTML. Mon premier réflèxe, bien sur, a été de rechercher sur Google les différents projets OpenSource mettant en œuvre un parser HTML, dans l'espoir de pouvoir le réutiliser dans mon application. J'ai donc consulté les documentations de plusieurs produits, comme la libxml2, la libgtkhtml, le parser de Mozilla, et une multitude d'autres, plus ou moins aboutis.

Après une sélection sommaire des quelques librairies semblant correspondre à ce que je recherchais, j'ai effectué une série de tests sur chacune d'elles, afin d'en comprendre l'utilisation, et d'en délimiter le périmètre fonctionnel. Au cours de ces tests, il m'est vite apparu, par exemple, que la libxml2 gérait correctement le HTML "propre" (genre XHTML), mais avait rapidement du mal avec le HTML du "monde réel" (souvent incorrect, du point de vue du W3C). Ce n'était bien sur qu'une demi-surprise, puisque cette librairie est avant tout un parser XML, étendue par la suite afin de pouvoir gérer "aussi" le HTML. De la même façon, la libgtkhtml m'imposait certaines contraintes, en particulier une forte dépendance vis-a-vis des structures de données Gnome, etc..

Je me suis rapidement rendu compte que dans tous les cas, le travail de "colmatage" et d'intégration allait me prendre beaucoup de temps. D'autant plus qu'il était nécessaire, dans la perspective d'une évolution de l'application, que je puisse également parser (je n'ai pas dit "interpreter", mais au moins "tokeniser") les définitions CSS ou les fonctions JavaScript qui pourraient apparaitre au détour d'une page.

J'ai donc pris une décision qui ferait sans doute dresser leurs cheveux sur les têtes des professionnels que vous êtes: développer mon propre parser HTML. Le système est basé sur une FSM (Finite State Machine, ou Machine à Etats), les transitions entre plusieurs tables d'états sont supportées via un simple système de stack, ce qui me permet d'avoir une state table dédiée au HTML, une autre pour les structures SGML, une pour les URI (ce qui n'est pas un luxe), une pour le JavaScript, et une pour les stylesheets.

Bien sur, j'ai eu droit aux railleries de circonstance ("tant que tu y es, refais aussi l'OS, les drivers Ethernet et la stack TCP/IP qui vont avec", etc..). Il n'empêche qu'aujourd'hui, je dispose d'un ensemble de classes répondant parfaitement à mes objectifs fonctionnels initiaux, et aux contraintes que je m'étais fixées (en particulier au niveau de la vitesse de traitement et de la gestion des erreurs). Plusieurs personnes sont intervenues sur le code depuis (principalement afin de développer de nouvelles state tables pour le support XML et SOAP), et l'apprentissage s'est fait sans mal. Le code (d'ailleurs minuscule puisque les state tables sont.. des tables

) est correctement documenté, et maîtrisé de A à Z par au moins deux personnes.

Cette expérience m'a poussé à m'interroger sur l'intéret de la réutilisation systématique du code fourni par la multitude de produits OpenSource, qu'on trouve par exemple sur SourceForge. Je sais qu'il s'agit d'un sujet sensible, mais le leitmotiv bien connu du "il ne faut pas réinventer la roue" est une évidence un peu trop facile; je dirais même qu'il faut parfois avoir une certaine dose de culot pour oser s'octroyer le droit de la proférer à tout va.

La communauté OpenSource est un fantastique viver de développeurs; mais alors qu'aujourd'hui la plupart projets qui en sont issus supportent sans problème la comparaison avec leur pendant commercial (ou sont en passe de le faire, on peut citer l'exemple des browsers web, des composants XPCOM (Mozilla) vs. MSCOMM (Microsoft), des suites bureautiques et bien sur.. des OS eux-mêmes), on a parfois l'impression que la créativité qui les caractérisait traditionnellement est de moins en moins présente, et que leur dynamique de développement s'inscrit progressivement dans une logique d'inertie. Une grosse moyenne mobile, à l'échelle de la communauté toute entière. C'est sans doute ça qu'on appelle la maturité.

Mais c'est encore au niveau individuel (le développeur, ou le petit groupe de développeurs) que ce phénomène est le plus visible. L'exemple du parser HTML (peut-être un peu long, veuillez m'en excuser) en est tout-à-fait représentatif.

La plupart des intervenants sur ce forum sont sans doute des ingénieurs, soit par leurs études, soit par leur expérience qui dans un environement professionnel leur confère un rôle d'ingénieur. Ce rôle, justement, est d'identifier des problèmes, puis de proposer et de superviser la mise en place de solutions répondant à ces problèmes (généralement sous certaines contraintes techniques, de temps, du budget, etc..). Sans tomber dans les clichés folkloristes, on les suppose donc doués d'une certaine créativité, a priori dynamiques et ouverts d'esprit.

Pour avoir passé pas mal d'années en SSII (mais heureusement, au moins autant dans des Start-Up

), je sais que beaucoup d'ingénieurs (souvent les plus jeunes, malheureusement) correspondent plus au prototype du "fonctionnaire", dans tout ce que ce terme peut avoir de péjoratif, qu'au profil que j'ai tenté d'ébaucher plus haut. Beaucoup d'entreprises technologiques sont demandeuses de talents, de gens qui osent proposer des solutions originales, parfois très simples, mais véritablement adaptées à des problèmes spécifiques, et se retrouvent avec de "jeunes actifs" en cravate PlayStation, qui ne savent qu'intégrer (souvent mal) des produits génériques (un peu de libgbidule par ici, un system() pour appeler la suite OpenBloatedTruc par là, etc..), le tout au nom de la réutilisation des composants logiciels. Quelle blague!

Et l'OpenSource dans tout ça ? Il est malgré lui au cœur du problème. A produire, inciter à réutiliser et à mélanger entre eux, encore et encore, les mêmes composants génériques, de façon systématique, jusqu'au point où on ne se pose même plus la question de savoir si on a vraiment besoin d'embarquer la moitié d'un serveur web pour faire un "Hello world", on oublie que certains problèmes spécifiques demandent des réponses.. spécifiques. La biodiversité s'éteint, les performances aussi, et la passion avec.

-pirus.

**granquet** · 24/07/2006, 07h56

euh?
j'ai l'impression que tu rejette la faute de l'incompetence de certaines personnes sur l'open source ... c'est pas bien

.

serieusement ... il y'as tout un tas de libs diverses open source qui font un tas de trucs ... apres faut etre capable de choisir la lib qui vas bien ... ou de developper la sienne.

chaque bibliotheque as ete developpé avec une certaine idée de "généricité"; mais elles ont ete développé pour un besoin particulier (aye, je sais pas si je suis clair)
quand on auras trouvé la bibliotheque qui fait TOUT, qui le fait bien, dans toutes les situations, et qui pese pas 500Mo, on auras trouvé le graal

en attendant faut se retrousser les manches

**narmataru** · 24/07/2006, 10h35

Je comprends tout à fais ton point de vue. Mais comme le dit Dark_Ebola c'est plus l'incompétence de certain que le status de l'open-source qui est mis en avant.
L'open-source (du moins la licence GPL) a été définie pour 3 raison :
- pouvoir utiliser un logiciel sans restriction
- pouvoir modifier le logiciel pour enlever un bogue ou ajouter une fonctionnalité
- pour redistribuer le logiciel librement (en garantissant au destinataire les même droit sur sa copie)

Après intégrer ou non un composant libre dans un projet c'est comme tout aute intégration de composant. Ca ne sert à rien d'intégrer un composant inadapter. Il vaut mieux le créer de toute pièce dans certains cas.
Mais en même temps, si il existe un composant libre qui correspond au besoin pourquoi s'en priver ?

**K-Kaï** · 24/07/2006, 11h04

Je suis d'accord avec les autres forumeurs (tiens je sais pas si ca ne va pas finir dans le dictionnaire ce terme ...) et je rajouterai même que l'opensource est en train de devenir un peu victime de son succès :

En effet j'ai l'impression que pas mal de monde, au lieu de compléter et améliorer un projet existant avec les fonctionnalitées dont ils ont besoin, tendent à créer leur propre projet avec parfois pas mal de problèmes. Alors qu'en contribuant à un projet déjà existant, on bénéficie du regard des autres developpeurs sur son code et d'une entre-aide plus grande.

Maintenant, il est vrai que dans certain cas, il vaut mieux travailler de son coter afin de ne pas totalement surchargé un projet existant.

Je pense qu'il y aurait vraiment à recadrer l'esprit de l'opensource chez les novices (et pourtant, j'en suis un également, je n'est pas non plus 10 ans de dev derrière moi).

Je suis par contre bien d'accord pour dire que le boulot de developpeur, principalement dans le genie logiciel ressemble de plus en plus à de l'assemblage, paramétrage de briques qu'à de l'algorithmique pure.

**pirus** · 24/07/2006, 14h39

je vous remercie tous pour vos commentaires (et pour avoir eu le courage de lire ce long post.. promis je vais eviter de recommencer !).

la communaute OpenSource souffre encore manifestement d'une image (parfois justifiee) d'amateurisme. heureusement, elle se professionnalise de plus en plus: des societes de services comme IDEALX (pour ne citer qu'eux) se proposent comme partenaires aupres de grands comptes pour le developpement et l'integration de solutions basees sur des produits OpenSource (et en general, la qualite est au rendez-vous, si je me base sur les quelques "specimens" avec qui j'ai eu le plaisir de travailler.. et de boire des bieres

).

mais effectivement, l'art du combat se perd (il s'agissait d'une reference a Sun Tzu, tous ceux qui ont pense a Top Gun peuvent sortir

).

merci a tous,
-pirus.

**K-Kaï** · 24/07/2006, 14h57

FAudrait voir, on pourrais discuter sur le sujet, lancer un debat, ton post est peut être long mais loin d'être dénué de sens. Je trouve qu'il serait dommage qu'il tombe de suite dans les abimes du forum ...

**ggnore** · 24/07/2006, 16h16

Envoyé par K-Kaï

FAudrait voir, on pourrais discuter sur le sujet, lancer un debat, ton post est peut être long mais loin d'être dénué de sens. Je trouve qu'il serait dommage qu'il tombe de suite dans les abimes du forum ...

Pourquoi ne pas noter ce thread afin qu'il ait beaucoup d'étoiles et attire ainsi l'attention ?

**K-Kaï** · 24/07/2006, 16h22

Merci du conseil, je n'avais jamais capté cette fonctionnalité sur le forum

**vosaray** · 24/07/2006, 23h56

Hem Hem,

desolé, je ne peux m'mpecher d'ajouter mon grain de sel

Oui l'open source est un gigantesque vivier, et comme dans tous les viviers on y trouve de tout, du bon, du mauvais, du fait sur mesure pour la problematique souhaité ainsi que du 'generique' qu'il faudra fotement specialiser pour ses propres besoins.

Je suis d'accord que la plupart des outils open source necessitent du temps et des compenteces pour reussir une integration.

Je pense que le principal avantage de cette 'architecture' de dev est justement l'integration, car basé sur de l'open source, elle est plus ouverte que l'integration proprietaire.

Cela ne veut pas dire qu'elle est moins complexe ni difficile a realiser, simplement qu'il y potentiellement plus de personnes succeptibles de la realiser.

Personellement, je vois en cela un axe majeur de buisness a devlopper. D'ailleurs IBM, HP, Oracle, MySQL et d'autres l'ont tres bien compris et le mettent en place.

Je dirais que dans la plupart des cas, cette 'philosophie d'integration' apporte du travail accessible a un plus grand nombre de personnes que les technos propritaires.

Il est aussi vrai qu'il y a de la disparité et de la duplication dans les projets, et que ce n'est pas forcement benefique. Des fois cela le reste car le meilleur projet reste en vie, les autres meurent progressivement.

Dans tous les cas, je suis assez d'accord avec la philo qui consiste a developper un outil qui convient a un besoin a un moment donné, meme si il existe des 'generiques' qu'il faudra integrer et qui seront, peut etre, plus viables a terme, mais il est toujours difficile d'anticiper le contexte futur.

Je pense qu'il ne faut pas avoir honte d'utiliser la techno et les outils qu'on maitrise plus, sous pretexte que c'est pas open source donc pas bien.

C'est malheureusement un discours que j'entends souvent et qui rime a rien du tout.

Et pourtant je suis un adepte convaincu des outils open source, et je reste intimement persuadé qu'il sont et resteront l'avenir de la R&D en info.

**DaZumba** · 25/07/2006, 10h34

Envoyé par pirus

la communaute OpenSource souffre encore manifestement d'une image (parfois justifiee) d'amateurisme.

Je ne suis pas sur. Il y a des projets Open Source de tres grande qualite (Linux, Mozilla et Firefox, Apache, OpenOffice [a partir de la v2.0!] pour ne citer que les plus evidents).

Il ne faut pas non plus sacraliser le developpement 'professionnel'. Beaucoup de projets Closed Source connaissent le meme cycle de vie que les projets Open Source: on commence par un produit de qualite moyenne (Windows NT 4.0, par exemple) puis on l'ameliore (a coup de patches, s'il le faut) jusqu'a atteindre un produit de bonne voire tres bonne qualite (Windows XP, par exemple). Sur de tres gros projets, cela me parait imparable -- a moins de ne sortir une version que tous les 10 ans, au risque de se prendre un produit concurrent dans la gueule. Egalement, il y a des projets commerciaux Closed Source qui sont franchement mauvais, notamment dans les jeux videos. Il me serait facile de comparer un bon jeu Open Source a un mauvais jeu Closed Source, et tirer une conclusion inverse a la tienne...

**pirus** · 25/07/2006, 21h31

Salut,

Envoyé par DaZumba

Je ne suis pas sur. Il y a des projets Open Source de tres grande qualite (Linux, Mozilla et Firefox, Apache, OpenOffice [a partir de la v2.0!] pour ne citer que les plus evidents).

hehe.. on derive tranquillement vers la comparaison entre logiciels libres / non commerciaux et proprietaires / commerciaux.

je ne cherche pas forcement porter de jugement sur l'un ou l'autre; comme l'ont fait remarquer plusieurs personnes, il y a du bon et du mauvais, des deux cotes. j'observe par contre (et c'est mon opinion, tout le monde ne la partage pas forcement) que ce qui a fait pendant longtemps une partie de l'identite de l'OpenSource (cette capacite a innover et a ne pas avoir de complexe) est de moins en moins visible aujourd'hui, y compris (et peut-etre surtout) au niveau des developpeurs.

le fait d'etre arrive a un niveau de parite avec les produits commerciaux en est peut-etre une des raisons (maintenant que "voila, c'est fait", il n'y a peut-etre plus grand chose a prouver, d'un point de vue technique en tout cas, puisqu'il n'y a plus vraiment de modele a depasser).

maintenant que l'OpenSource est quasiment devenu une "norme", qu'on a des licences, quelques tres bons OS, pas encore d'API universelle a la MFC, mais ca ne va sans doute pas tarder, et surtout un modele economique et une legitimite naissante, pas mal de gens on le reflexe de vite vite s'identifier a cette norme, remettre les oeilleres, et repasser en "pilote automatique".

gare alors, a ceux qui oseraient emettre quelqu'idee originale, ou suggerer que dans tel contexte bien specfique, on puisse faire mieux en redeveloppant quelque-chose plutot qu'en utilisant une lib toute faite, piochee sur sourceforge, et finalement developpee par un type comme les autres, si ce n'est qu'il y a cru, lui.

chaque communaute a sa "pensee unique", et il me semble que l'OpenSource a fini par trouver la sienne (mais a part ca, qu'est-ce que c'etait chouette

). Il appartient a chacun d'en tirer le meilleur parti, et effectivement, lorsque c'est possible, d'en faire profiter tous les autres.

-pirus.

**vosaray** · 26/07/2006, 00h01

Envoyé par pirus

Salut,
maintenant que l'OpenSource est quasiment devenu une "norme", qu'on a des licences, quelques tres bons OS, pas encore d'API universelle a la MFC

La je ne comprends pas ... MFC = API universelle ? C'est une blague ?

[ Non je ne vais pas m'etaller sur les MFC, bonjour le troll, fossilien de surcroit ! ]

Par contre (desolé si c'est hors topic) mais qu'est donc une API universelle ?

Comment une API 'universelle' pourrait t'elle exister ?

Une API c'est une interface de programmation.

Des interfaces, dans un monde heterogene, il en existe autant qu'il y a de systemes et de besoins d'integration.

Or notre monde est heureusement heterogene et non monolotique. Chaque systeme a ses contraintes et son architecture, ainsi que sa maniere de communiquer...

C'est le genre de reflexion qui me rappellent qu'il existait aussi une langue universelle appelé "l'esperanto". Vu le succes de la chose, bon courage à toutes les APIs universelles

chaque communaute a sa "pensee unique", et il me semble que l'OpenSource a fini par trouver la sienne

Je ne vois pas trop à quelle "pensee unique" tu fais reference. Ou as tu lu/vu/entendu/senti une queconque uniformité de pensée dans le monde open source ?

Critiquer les 'tendances à open source' voire la qualité des logiciels en crculation est une chose.

De la a inventer une penseé 'unique' ( pourkoi pas 'universelle' tant qu'on y est) pour l'open source, il y a un pas qu'il faudrait vraiement eviter de franchir...

**K-Kaï** · 26/07/2006, 09h30

Il est vrai que nous sommes arrivé vraiment nopn plus à la cheville, mais plutot à l'oreille du monde propriétaire commercial. A tel point que des logiciels commerciaux utilisent des briques opensource dans leur code et que c'est même éditeurs de logiciels commerciaux commencent à prendre en compte dans leur compatibilité le monde du libre.

Mais maintenant, pour aller jusqu'au bout ce qu'il faut c'est dépasser les systèmes/log commerciaux tant au niveau qualité, qu'en nombre d'utilisateur ...

En effet, on assiste depuis quelque temps, parallèlement à la maturité des developpement libre à une monté de la communication autour de ceux ci. C'est de moins en moins le choix des initiés je trouve et cela n'est pas pour déplaire.

**narmataru** · 26/07/2006, 11h07

Il ne faut pas confondre logiciels fermé et commerciaux ! Un logiciel libre peut très bien être vendu ! Les plus gros logiciels libre sont financé par des société visant la rentrée d'argent (et c'est normal).
Un logiciel commercial peut être libre
Un logiciel gratuit peut être fermé (exemple la majorité des freeware)
La distinction ne se fait pas au niveau du prix mais au niveau des droit de l'utilisateur sur le logiciel.

**K-Kaï** · 26/07/2006, 11h36

On est bien d'accord la dessus.

Sauf qu'un logiciel libre même vendu peut être modifié pour ajouter des fonctionnalité

Desolé si ce n'est pas moi que tu visais par ton post mais je pensais qu'il était clair à ce niveau.

**pirus** · 26/07/2006, 14h31

hello,

Envoyé par narmataru

Il ne faut pas confondre logiciels fermé et commerciaux !

Envoyé par K-Kaï

On est bien d'accord la dessus.

on est tous d'accord la-dessus

. j'ai hesite a developper (suite a l'intervention de DaZumba qui parlait justement de "Closed Source" et "Open Source", ce que j'ai interprete comme une volonte de ne pas assimiler "Open Source" a "gratuit" et "Closed Source" a "commercial"). il y avait sans doute un raccourci malheureux dans mon message.

Envoyé par vosaray

La je ne comprends pas ... MFC = API universelle ? C'est une blague ?
[...]

ce que je veux dire par "API universelle", c'est que ce qui fait l'identite de la plateforme de Microsoft aujourd'hui, du point de vue du developpeur, c'est l'API (et dans ce cas, a priori, la MCF). a la limite, que tu codes, en C++, en C#, en Java, en Delphi, ou en VB ne change rien, c'est juste un detail de syntaxe, presque un "vulgaire" probleme d'interface utilisateur.

Sun a fait la meme chose avec les Java Fundation Classes (JFC), et les deux sont d'ailleurs assez proches.

si on suit ces deux modeles, un environement de developpement aujourd'hui c'est quelques langages (C++, Java, etc..), dont le nombre et les differences syntaxiques sont quasiment anectodiques, et surtout une hierarchie standardisee de classes, qui constitue le coeur de cet environement.

ca, on ne l'a pas encore. on a "la suite KDE" avec son SDK, "la suite Gnome" avec son SDK, le sourcetree Mozilla (tres interessant d'ailleurs) avec son SDK, wxWidgets (qui depasse maintenant completement le simple perimetre du "GUI multiplateforme"), et surement plein d'autres, qui sont autant d'environements de dev coherents. bref, on a le choix (ce que je trouve plutot sympa car il y a de bonnes idees a prendre partout, mais qui peut etre handicapant lorsqu'il s'agit d'integration).

la coherence (ne serait-ce que d'un point de vue visuel) entre les applications est sans doute ce qui reste encore une des plus grosses differences entre un Windows et un Linux + (justement.. plus quoi ?

), du point de vue de l'utilisateur.

Envoyé par vosaray

Je ne vois pas trop à quelle "pensee unique" tu fais reference. Ou as tu lu/vu/entendu/senti une queconque uniformité de pensée dans le monde open source ?

desole de prendre un exemple qui peut porter a polemique, mais oui, certainement, et en 3 lettres: GNU. je ne sais pas si tu as deja assiste aux "shows" de Stallman (la premiere fois que je l'ai vu, c'etait au FOSDEM a Bruxelles, en 2001 je crois, ca s'appellait encore "OSDEM" a l'epoque), mais un amphi plein a craquer qui reprend d'une seule voix la Free Software Song, devant un type deguise en guru/messie, meme si c'est pour rire, j'y trouve un petit gout Orwellien (c'est bon, maintenant que j'ai dit ca, je vais me faire bannir a vie de developpez.net, j'ai simplement pris cet exemple car c'est celui qui m'a marque le plus).

Envoyé par K-Kaï

Mais maintenant, pour aller jusqu'au bout ce qu'il faut c'est dépasser les systèmes/log commerciaux tant au niveau qualité, qu'en nombre d'utilisateur ...

tout a fait d'accord avec toi. c'est deja fait dans certains cas d'ailleurs (Apache et techno associees vs. IIS et technos associees).

-pirus.

**DaZumba** · 26/07/2006, 14h53

Envoyé par pirus

on est tous d'accord la-dessus

. j'ai hesite a developper (suite a l'intervention de DaZumba qui parlait justement de "Closed Source" et "Open Source", ce que j'ai interprete comme une volonte de ne pas assimiler "Open Source" a "gratuit" et "Closed Source" a "commercial"). il y avait sans doute un raccourci malheureux dans mon message.

Oui, je compare Closed Source vs. Open Source (il y a un commercial qui s'est glisse dans mon message, ce qui a du t'egarer). Mon point est que je ne vois pas comment le fait que les sources du produit fini soient publiques puisse entrainer un 'nivellement par le bas'.

Envoyé par pirus

la coherence (ne serait-ce que d'un point de vue visuel) entre les applications est sans doute ce qui reste encore une des plus grosses differences entre un Windows et un Linux + (justement.. plus quoi ?

), du point de vue de l'utilisateur.

Remarque que cela est completement independant de la notion d'Open Source, qui signifie simplement que les sources sont publiques. Cela n'implique pas l'utilisation de tel modele de developpement, une innovation accrue, ou une norme que les gens doivent suivre. Que l'on juge que le developpement du logiciel libre se fasse de facon anarchique, peut etre -- ca va se corriger ou pas, on verra. Apres tout, l'API Microsoft reste plombee par la compatibilite avec les versions precedentes (restes de Win16, fonctions Ex, etc.). Les gros developpements vieillissent mal, qu'il soient libres ou proprietaires.

**frp31** · 26/07/2006, 15h47

salut

[....]mais avait rapidement du mal avec le HTML du "monde réel" (souvent incorrect, du point de vue du W3C)[....]

le seul html réel est le certifié w3C non ?

**Michaël** · 26/07/2006, 16h10

Envoyé par frp31

le seul html réel est le certifié w3C non ?

je pense qu'il était question du html codé à la dégueu comme une bonne partie des sites... va voir les sites perso et si tu trouves que 90% sont conformes à w3c, alors bravo

c'est le html qu'on rencontre le plus souvent malheureusement

**pirus** · 26/07/2006, 16h29

Envoyé par DaZumba

Mon point est que je ne vois pas comment le fait que les sources du produit fini soient publiques puisse entrainer un 'nivellement par le bas'.

tu as raison. mon probleme la, c'est que je ne peux pas fournir d'exemple sans donner l'impression de "taper" sur un produit OpenSource.. ou sans livrer des secrets

bon, j'etais parti sur l'exemple du HTML, alors autant le reprendre. donc j'ai un parser, qui prend un flux HTML en entree, et qui me sort des tokens. ce HTML que je viens de parser, je dois le renvoyer a un client (je suis un proxy). si possible, j'aimerais zipper le HTML a la volee (et tres vite, quitte a ne pas avoir un taux de compression terrible).

si t'as ces contraintes-la et que tu en parles autour de toi, tout le monde va te dire "utilise la libgzip, et au besoin rajoute une carte acceleratrice pour la compression". bien sur. maintenant, en parcourant quelques RFC, tu t'appercois qu'il existe plusieurs algos de compression en HTML (gzip, compress et deflate). "deflate" par exemple, c'est les RFC 1950 et suivants: une combinaison de LZ77 et de Huffman, dont le principe consiste a encoder de (si possible) longues sequences d'octets sur un nombre de bits d'autant plus restreint qu'elles apparaissent souvent dans le flux.

ca veut dire que ta libgzip construit un dictionnaire des sequences (plusieurs en fait), fait des recherches couteuses dans pas mal de structures, beaucoup d'allocations memoires, etc.. en un mot, c'est relativement lent.

maintenant, toi tu as deja un parser, qui fait la moitie du boulot (il "tokenise" le HTML, donc il reconnait les mots cles, qui deviennent du coup tes sequences). ton dico, tu l'as aussi (puisque tu as quelque-part une liste des mots cles a tokeniser). maintenant si tu regardes le source HTML de cette page de forum, tu verras que malgre mes messages longs et ennuyeux

, il reste malgre tout enormement de HTML, de CSS, bref.. de contenu "peripherique", que ton parser sait gerer. partant de la, pourquoi ne pas compresser uniquement cette partie du contenu, et laisser passer le reste en clair (ce qui, techniquement, est possible, voir le RFC1951, Sec. 3.2.4, "Non-compressed blocks") ?

alors la, bien sur, tu peux oublier completement la libgzip.. mais tu peux surtout t'attendre a une efficacite incomparable, si tu rapportes le taux de compression au nombre de cycles CPU necessaires.

c'est genrealement a ce moment que t'as un type qui debarque d'on ne sait ou (enfin si, souvent d'une ecole d'inge quelconque), et qui te dit que "mais te prends pas la tete" ou "vas-y, reecris aussi l'OS pendant que tu y es". mais n'empeche, pour moi (et pour toi aussi, j'en suis sur, et je l'espere, pour la majorite des gens ici), le vrai plaisir du dev, c'est ca.

mon histoire de "nivellement par le bas" n'etait donc pas un requisitoire contre l'OpenSource, mais plutot contre le "confort" qu'il procure, et l'hypocrisie de ceux qui se refugient derriere des "mais puisque ca existe deja" pour s'eviter d'oser des choses un peu audacieuses, mais tellement plus valorisantes et generatrices de satisfaction (la bonne, la vraie) que de lire 3 manpages et d'ajouter un "-lgzip" quelque-part dans un Makefile.

j'espere avoir repondu par la meme occasion aux interrogations concernant la "pensee unique" (encore desole pour RMS les gars :p).

-pirus.

(et tant pis pour les secrets, mais c'etait le dernier

)

OpenSource - Nivellement par le bas ?

Linux

Discussions similaires

Partager

Partager