Breizhogeek, le blog qu'il sent bon la bretagne

Aller au contenu | Aller au menu | Aller à la recherche

Catégories

mercredi 9 juin 2010

Google présente Caffeine

En effet, le 6 juin, Goo­gle a pré­senté sur son blog un nou­veau sys­tème d’indexa­tion et pro­met des résul­tats 50% plus “frais”. C’est direc­te­ment lié à l’indexa­tion en temps réel dont on a tant parlé il y a peu : dès qu’un post sur un blog, un forum ou encore twit­ter est créé, vous pou­vez le trou­ver sur Goo­gle.

Goo­gle expli­que le choix de créer un nou­veau moteur par la crois­sance du web et de ses médias : cha­que page devient plus com­plexe, plus riche en médias: video, audio, don­nées en temps réel (ex: récu­pé­ra­tion de flux rss/atom via ajax), etc… L’accès à une infor­ma­tion ou don­née doit donc se faire aisé­ment et rapi­de­ment, selon divers axes. Ils résu­ment cette idée par un schéma ma fois rigolo et sim­ple :


L’ancien sys­tème com­por­tait en réa­lité dif­fé­ren­tes cou­ches et ces dif­fé­ren­tes cou­ches étaient mises à jour indé­pen­dam­ment de cha­cune et à des inter­val­les dif­fé­rents. Ainsi la cou­che prin­ci­pale néces­si­tait de repar­cou­rir tout le web pour en recons­truire l’index, ce qui avait pour résul­tat d’avoir une mise à jour “uni­que­ment” tou­tes les deux semai­nes.

Avec Caf­feine, Goo­gle ana­lyse le web par por­tions et cha­que nou­vel élé­ment est ajouté ainsi direc­te­ment à l’index. Cela per­met un par­cours de cen­tai­nes de mil­liers de pages à la seconde. Cette ana­lyse gigan­tes­que est réper­to­riée sous la forme d’une base de don­nées non moins gigan­tes­que de 100 000 Tera­by­tes. En effet par jour ce sont des cen­tai­nes de Tera­by­tes qui sont ajou­tés à cette base !

Par ce nou­veau moteur, Goo­gle voit loin : il décrit Caf­feine comme un moteur puis­sant mais éga­le­ment robuste, capa­ble de s’adap­ter à la quan­tité gran­dis­sante d’infor­ma­tions et exten­si­ble pour accep­ter un encore meilleur sys­tème de recher­che.

samedi 24 avril 2010

Repenser les forums web

Cet arti­cle pro­pose une courte réflexion sur les forums web et leur uti­li­sa­tion et ques­tionne les outils asso­ciés aux prin­ci­paux moteurs de ces der­niers (phpBB, fire­board, punBB, etc.).

captureforum.png

L’uti­li­sa­tion des labels

Cha­cun a déjà surfé sur des forums – ou fora pour les puris­tes réfrac­tai­res à la réforme de 1990 – ou en uti­lise même régu­liè­re­ment. Cha­cun s’est donc au moins une fois retrouvé devant le dilemme sui­vant : dans quelle caté­go­rie pos­ter ou cher­cher un sujet ? Ex: j’ai une ques­tion assez pré­cise qui tou­che à la fois au gra­phisme et au design web et à la pro­gram­ma­tion. Pla­cer cette ques­tion dans l’une ou dans l’autre des caté­go­ries “Pro­gram­ma­tion”, “Gra­phisme”, “Web” est assez déli­cat car aucune n’est réel­le­ment adap­tée en soi à ma ques­tion : celle-ci relève d’une com­bi­nai­son des trois caté­go­ries.

L’idée ici est donc de sor­tir les forums de leur archi­tec­ture habi­tuelle (je pense à PhpBB, PunBB, etc.) et de per­met­tre une uti­li­sa­tion/clas­si­fi­ca­tion sur plu­sieurs niveaux, notam­ment via des labels asso­ciés aux sujets et créant un lien entre un sujet et une ou plu­sieurs thé­ma­ti­ques. Cepen­dant, s’il est impor­tant qu’un sujet puisse appar­te­nir à plu­sieurs thé­ma­ti­ques, il est pro­ba­ble­ment inté­res­sant de le rat­ta­cher obli­ga­toi­re­ment à un label plus ou moins géné­ral : on erre par­fois dans les forums sans cher­cher. Cer­tains labels sont donc plus géné­raux que d’autres et donc plus impor­tants. On affecte alors à cha­que éti­quette (ou tag ou label) un ordre d’impor­tance. La nuance ici entre une éti­quette de pre­mier niveau et une caté­go­rie (dans le sens actuel) est que le sujet peut très bien appar­te­nir à plu­sieurs labels de pre­mier niveau.

La co-rédac­tion

Un autre élé­ment man­quant par­fois aux forums en géné­ral c’est qu’il n’existe pas la pos­si­bi­lité de co-rédi­ger un sujet. Ima­geons : 2 ou plus mem­bres d’un même forum se con­nais­sent mutuel­le­ment et ont en com­mun un pro­jet. Ils sou­hai­tent pré­sen­ter le dit pro­jet à la com­mu­nauté. Le blo­cage actuel est qu’ils doi­vent soit créer un nou­veau compte uti­li­sa­teur qui les englo­bera tous, soit le sujet doit être créé par un seul d’entre eux et ,ne béné­fi­cient alors pas d’outils comme “m’aver­tir lors­que quelqu’un répond à mon topic” et ne peut pas non plus modi­fier le post en cas de besoin ou encore repren­dre les rênes car l’auteur ini­tial a démis­sioné, est porté dis­paru etc.. Notre forum devra donc per­met­tre qu’un sujet soit en fait la pro­priété de plu­sieurs auteurs.

Je ne suis pas trop fami­lier avec cette repré­sen­ta­tion mais cer­tains sem­blent l’appré­cier, j’ai donc essayé de vous pré­sen­ter un schéma MCD d’un forum web tout sim­ple (on peut faci­le­ment ima­gi­ner des champs plus nom­breux, plus pré­cis ou encore des asso­cia­tions plus opti­mi­sées).

MCD du Forum Le MCD a été conçu via MySQL Work­bench.

La com­mu­ni­ca­tion

Si nous n’avons pas plus besoin main­te­nant de pos­ter plus rapi­de­ment sur un forum que pré­cé­dem­ment (ce n’est pas une pla­te­forme de mes­sa­ge­rie ins­tan­ta­née après tout), nous pou­vons être inté­res­sés par le fait d’être plus rapi­de­ment au cou­rant d’une réponse à un sujet donné. Le forum doit donc pou­voir noti­fier l’uti­li­sa­teur de manière quasi-ins­tan­ta­née en cas de nou­vel­les répon­ses ou lors d’un évè­ne­ment pré-enre­gis­tré par l’uti­li­sa­teur (ex: ajout d’un sujet ayant pour tag “typo”. La solu­tion la plus sim­ple est pro­ba­ble­ment d’uti­li­ser une con­ver­sa­tion via le pro­to­cole xmpp : cela per­met de tou­cher les gens via Jab­ber, GTalk, etc..

Don­nées et archi­vage

Le but ici est de faci­li­ter l’accès et la lec­ture aux uti­li­sa­teurs. Faci­li­ter l’accès c’est notam­ment évi­ter à l’uti­li­sa­teur de répé­ter inces­sa­ment les mêmes infor­ma­tions. Par exem­ple lors de l’ins­crip­tion, la mise en place de la tech­no­lo­gie Ope­nID per­met­trait de récu­pé­rer les infor­ma­tions sou­hai­tées depuis son compte direc­te­ment. Il fau­dra éga­le­ment per­met­tre la modi­fi­ca­tion de ces valeurs une fois enre­gis­tré en pro­po­sant de récu­pé­rer à nou­veau les infor­ma­tions depuis le four­nis­seur d’iden­tité.

La lec­ture, hor­mis à tra­vers l’ergo­no­mie du forum lui-même, c’est de con­si­dé­rer le forum comme une large base de con­ver­sa­tions multi-uti­li­sa­teurs. Or ces con­ver­sa­tions sont sou­vent orien­tées pra­ti­que : demande d’un con­seil, d’aide, d’une astuce. On peut ainsi sou­hai­ter archi­ver ces con­ver­sa­tions pour soit gar­der une trace de ce qu’on a dit ou ce que les autres ont dit, à la manière d’un client de mes­sa­ge­rie ins­tan­ta­née en fait, soit pour pou­voir accé­der n’importe quand et depuis n’importe où (ex: sans con­nexion inter­net) au con­seil ou à l’astuce dis­cu­tée. Il est alors impor­tant de pro­po­ser un archi­vage des sujets dans un for­mat ouvert ; reste à choi­sir lequel : un sim­ple fichier PDF ? Per­son­nel­le­ment je pen­che­rais pour un for­mat déjà exis­tant et dédié à la dis­cu­tion : Mbox, un for­mat ouvert de sto­ckage d’emails et faci­le­ment con­ver­ti­ble.

Pro­cé­dure de dif­fu­sion d’un hypo­thé­ti­que moteur de forum

Afin de per­met­tre une plus large dif­fu­sion de ce moteur de forum, il faut tou­cher à la fois les uti­li­sa­teurs bien sûr (via les fonc­tion­na­li­tés décri­tes plus haut) mais éga­le­ment les déve­lop­peurs et web­de­si­gners.
Ce qui est gênant et frus­trant avec la plu­part des moteurs actuels de forums web c’est qu’il est peu aisé de créer une inter­face belle et ergo­no­mi­que : on est sou­vent limité. L’idéal pour le web­de­si­gner serait de pou­voir créer inté­gra­le­ment l’inter­face du forum en y pla­çant à sa guise les élé­ments le com­po­sant, via un lan­gage de tem­plate sim­ple, comme celui de SPIP : à par­tir de bali­ses et de bou­cles pré­sen­tes dans un sim­ple fichier HTML (donc déjà connu du web­de­si­gner).

Dans le même style – per­met­tre aux non-pro­gram­meurs de para­mé­trer le forum comme ils l’enten­dent – l’uti­li­sa­tion de fichiers PO faci­lite la tâche aux éven­tuels tra­duc­teurs : le for­mat est connu et exploi­ta­ble par de nom­breux logi­ciels. La pla­te­forme de forum gagne alors en acces­si­bi­lité lin­guis­ti­que.

jeudi 11 février 2010

État de la vidéo sur le web

Comme tout le monde le sait pro­ba­ble­ment main­te­nant, html5 per­met d’inté­grer une vidéo dans une page web (tout autant que de l’audio). La ques­tion qui se pose alors est le choix de l’enco­dage. Fire­fox, à tra­vers la Mozilla Foun­da­tion, a donc opté pour le for­mat de vidéo libre OGG Theora tan­dis que d’autres comme Apple ou encore Goo­gle lui ont pré­féré le h264. Il m’a alors sem­blé inté­res­sant de faire un réca­pi­tu­la­tif à la fois de la pro­blé­ma­ti­que, des enjeux et des for­mats en lice pour cet élé­ment.

Le h264 : un élé­ment dan­ge­reux pour le web ?

You­tube, et donc Goo­gle, a opté pour le for­mat h264 pour la dif­fu­sion de vidéos sur le web via cet élé­ment, suivi de près par Vimeo, et allant à l’encon­tre d’un des pre­miers à implé­men­ter cette balise : Dai­ly­mo­tion.

Le pro­blème ici est que le h264 n’est pas libre et est donc sujet à une license pro­prié­taire limi­tant le droit d’uti­li­sa­tion. Ainsi, même si l’uti­li­sa­tion du codec est gra­tuite pour une uti­li­sa­tion sur le net jusqu’en 2016 [1] ; rien ne garan­tit cette gra­tuité dans le futur. 2016 peut sem­bler loin, mais mal­gré la rapi­dité de l’évo­lu­tion dans le domaine du mul­ti­mé­dia, html5 n’est encore pas un stan­dard mais reste un brouillon et les dif­fé­rents acteurs et navi­ga­teurs n’implé­men­tent pas tous cet élé­ment (je pense notam­ment à IE, seule la ver­sion 9 devrait – la pré-ver­sion ne le mon­tre pas – le pro­po­ser ; or lorsqu’on voit com­ment IE8 tarde déjà à rem­pla­cer ses aïeux…) et nous som­mes déjà en 2010. Les 5 ans nous sépa­rant de la fin de cet accord ne me parais­sent pas si loin­tains… L’espoir réside donc dans le fait que Goo­gle vienne de rache­ter (enfin, il y a un mois main­te­nant, étant donné ma rapi­dité à rédi­ger un billet) On2, la société édi­trice de l’OGG.

Ogg Theora : une réelle alter­na­tive ?

Est-il vrai­ment néces­saire d’atten­dre une quel­con­que amé­lio­ra­tion de ce codec pour le pré­fé­rer au h264 ? En effet, selon cer­tains tests, il serait aussi per­for­mant, voire plus, que son con­cur­rent sur un fai­ble bitrate : h264_ogg.png Les vidéos com­pa­ra­ti­ves et de plus amples expli­ca­tions sont dis­po­ni­bles en anglais (du moins pour les expli­ca­tions) sur le site sui­vant : Xiph.org.

On peut donc espé­rer que ce rachat est un moyen pour Goo­gle d’amé­lio­rer encore le Theora et de rem­pla­cer le h264 par le Theora. Ce rachat est d’autant motivé par une amé­lio­ra­tion de l’expé­rience uti­li­sa­teur de la vidéo sur le web.
Je cite :

We’re exci­ted to wel­come the On2 team to Goo­gle and to con­ti­nue to enhance the video expe­rience for users on the web . Through rapid inno­va­tion in brow­sers and web stan­dards, the Inter­net is beco­ming the lea­ding plat­form for deve­lop­ment. We believe On2’s engi­nee­ring talent and tech­no­logy will be an incre­di­ble asset for us as we work to improve this plat­form.

Voici pour les anglo­pho­bes une tra­duc­tion approxi­ma­tive (de mon crû) :

Nous somme exci­tés d’accueillir l’équipe On2 chez Goo­gle et de con­ti­nuer à amé­lio­rer l’expé­rience vidéo pour les uti­li­sa­teurs web. Via une inno­va­tion rapide dans les navi­ga­teurs et stan­dards web, Inter­net devient une émi­nente pla­te­forme pour le déve­lop­pe­ment. Nous croyons que le talent et l’ingé­nio­sité de On2 sera un atout incroya­ble pour nous afin d’amé­lio­rer cette pla­te­forme.


Notes

[1] d’après l’arti­cle du 10 février 2010 de la MPEG LA dont voici un extrait : MPEG LA announ­ced today that its AVC Patent Port­fo­lio License will con­ti­nue not to charge royal­ties for Inter­net Video that is free to end users (known as Inter­net Broad­cast AVC Video) during the next License term from January 1, 2011 to Decem­ber 31, 2015.

dimanche 15 novembre 2009

Invitations Google Wave

Google wave

Bon je sup­pose que tout le monde en a entendu par­ler désor­mais, mais peut-être cer­tains n’ont-ils pas encore pu l’essayer… Voilà, je mets à dis­po­si­tion quel­ques invi­ta­tions, dis­po­ni­bles sur demande par com­men­tai­res :) .

mardi 30 décembre 2008

Petite pensée à tous ceux dont le site web est down ce soir

Bien content d'être encore up, je poste un petit billet de soutien aux clients dedibox (lesquelles seraient apparament inondées suite à un débordement de la Seine à Bezons) :D, courage !

- page 1 de 4