ZEROSECONDE.COM: janvier 2005 (par Martin Lessard)

ZEROSECONDE.COM

Impacts du numérique sur la communication, notre société, nos vies.

La moisson de l'implicite

"Bernardo Huberman et son équipe du Laboratoire d’information dynamique de Hewlett-Packard travaillent à décrypter comment les e-mails et les informations circulent à travers les organisations. Huberman et son équipe ont étudié des milliers d’e-mails et leurs parcours dans les divisions d’HP pour constater que le travail effectif était accompli par des équipes auto-sélectionnées qui n’avaient rien à voir avec l’organigramme. (...)

Selon Huberman, le groupe informel agrége les meilleurs sources et connaissances pour assurer son efficacité. Huberman indique qu’il souhaite construire un “navigateur de la connaissance d’entreprise” qui permettrait à des organismes de moissonner toute la connaissance cachées dans les cerveaux de leurs employés et pas seulement dans les documents stockés sur des serveurs ou dans les mails."
(via Internet Actu citant Computer world)
Toujours sur le même thème, via Kobelius, sur le même article:
"I see two theories of “knowledge” implicit in this discussion:

• Knowledge sits in people’s heads and can be harvested
• Knowledge emerges from people’s interactions and can be conjured through structured collaboration environments

Both theories are right, to a degree. Knowledge is a personal stock that we each build, and a social force field in which we radiate. Sometimes, you don’t know what you know until somebody/something elicits it from you."
Puisque la technologies évolue rapidement, il n'est pas ridicule de penser que (presque tout) ce que l'on dit ou écrit sera enregistré et traité afin d'extraire de la 'connaissance' (le comment reste à trouver).

Au regard de mon précédent billet, ce qui me gène, dans un scénario qui ne relève plus pour très longtemps de la science-fiction, c'est la possibilité pour une compagnie de faire des liens entre des choses que j'ai dit/écrit/fait pour créer de la valeur intellectuelle qui ne m'appartiendra plus par la suite, ou du moins qui ira enrichir les actionnaires, sans que je sois invité à participer aux bénéfices.

Venant d'un bloggeur semant ses pensées aux quatre vents, cela peut paraître paradoxal, mais je sens qu'ici il y a un enjeu crucial à propos de la propriété intellectuelle. Il est peut-être temps que je m'intéresse aux Creative Commons moi aussi...

Causalité et interactions cognitives d'une idée

Martin Dugage, l'auteur de la charte du KM, répond à mon billet sur cet extreme KM qui séduit mais effrait en même temps.
"On est donc confronté à une alternative simple et caricaturale. Soit on devient paranoïaque et, par peur des micros, des moteurs de recherche et des cookies, on part vivre dans une cabane. Soit on prend conscience de la nécessité vitale de bien maîtriser non la "connaissance", mais les flux d'information résultant du partage de cette connaissance, en laissant en permanence aux auteurs le pouvoir réel de décider par eux-mêmes où cette information ira ou n'ira pas."
(source)

Je suis bien conscient que son exercice de charte en reste un de rhétorique et mon opposition l'est tout autant. D'ailleurs, au premier niveau de principe, il y a là un effort louable de fouetter la classe des knowledge worker à faire ce pour quoi ils sont payés.

Mais ce sont les implications implicites que je vois poindre qui me tracassent. Mais explicitons d'abord les raisons implicites de mes craintes.

Premièrement je dois dire que je vis sur la partie Nord du continent américain où l'industrie et les sociétés n'ont pas été remarquées dans l'Histoire pour leurs actes sociaux : de la répression syndicales du début du dernier siècle au scandale Enron au début de celui-ci, en passant par des lois qui ont permis des crimes comme la chasse aux sorcières jusqu'à la prison Guantanamo, l'individu perd son statut de sujet pour être un objet. Est-il besoin de rapeller que le système ne favorise jamais les individus, que des particuliers de la classe dirigeante (scandale des commandites, délocalisation d'entreprises subventionnées, OMG, évasion fiscales, destruction des forêts boriales...)

Deuxièment, j'accorde que cette charte, parce qu'elle est écrite par celui qui veut publier un livre sur les réseaux de confiance constitue effectivement un intérêt certain, soit. Mais elle est écrite par un KManager de type top down alors que je suis donc un Personal Knowledge Manager de type bottom up. Par top down j'entends que le moteur clef pour faire avancer les choses passe par la volonté de la direction (et non la base). Par bottom up, j'entends un processus émergent de cette base volontaire. Une saine méfiance a le droit de s'installer.

Sachant cela, on comprendra le ton de ma note et l'expression extreme KM que j'emploi. Je que je perçois c'est le potentiel de dérapage systémique, comme il en arrive tant avec des bonnes idées sincères, sur le point de la propriété intellectuelle.

Voyons pour la charte. Compte tenu de mon billet sur la transmission et la transformation de la connaissance voici où se trouve le futur conflit tel que je le perçois.

Illustrons les interactions cognitives (mémos, appels téléphoniques enregistrées, meetings, rapports, échange épistolaires et rapports de lecture) dans une compagnie capable de capter et de traiter toutes ces interactions.

- X représente une interaction cognitive, quelle qu'elle soit, dans la sphère des idées, que ce soit de ma part ou celles des autres.
- Supposons que chaque idée en génère 2 autres (quelle soit pleine ou "à moitié cuite").
- Chaque ligne correspond à un temps.

Figure 1

a::X
b::XX
c::XXXX
d::XXXXXXXX
e::XXXXXXXXXXXXXXXX
f::XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Au temps 'f', nous aurons 32 "idées".

Ce que la charte dit, et ce que Martin Dugage veut amener, c'est que les idées optenues sur les heures du boulot appartiennent à la compagnie.

Effectivement, si je trouve une idée génial d'un nouveau produit elle sera retravaillée pour devenir un produit commercialisable. Disons l'idée marquée '0' au temps 'f' du tableau suivant est une idée innovatrice. Une nouvelle pyramide part de cette idée pour construire le concept 'A' et se décline dans le temps:

Figure 2

a::X
b::XX
c::XXXX
d::XXXXXXXX
e::XXXXXXXXXXXXXXXX
f::XXXXXXXXXXXXXXXX0XXXXXXXXXXXXXXX
g::A
h::AA
i::AAAA
j::AAAAAAAA
k::AAAAAAAAAAAAAAAA
l::AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Le temps 'l' représente toutes les idées du produit à commercialiser.

Jusqu'ici pas de problème (je crois que c'est la raison pourquoi on paye les employés).

À priori seule l'idée innovatrice 0 a été exploitée par l'employeur pour créer le produit issu des réflexions A et les droits de propriétés intellectuelle lui revient (Article 1).

Supposons maintenant que je quitte l'entreprise au temps 'f' et part développer une idée b (dernière idée du temps 'f')

Figure 3

a::X
b::XX
c::XXXX
d::XXXXXXXX
e::XXXXXXXXXXXXXXXX
f::XXXXXXXXXXXXXXXX0XXXXXXXXXXXXXXb
L'article 1 stipule aussi que si je peux prouver que l'entreprise n'en fait rien, je peux l'utiliser.
Mais l'entreprise peut remonter la chaîne causale des idées et revendiquer le passé de 0.

Figure 4

a::0
b::X0
c::XX0X
d::XXXX0XXX
e::XXXXXXXX0XXXXXXX
f::XXXXXXXXXXXXXXXX0XXXXXXXXXXXXXXb

La chaîne causale fait partie de l'innovation même si elle ne sont que des essais-erreurs ou des idées partielles. La compagnie a les preuves enregistrées qu'elle exploite ces idées (chaînes en bleu). Mais cette chaîne concerne présupposément aussi l'historique de mon idée b:.

Figure 5

a::b
b::Xb
c::XXXb
d::XXXXXXXb
e::XXXXXXXXXXXXXXXb
f::XXXXXXXXXXXXXXXX0XXXXXXXXXXXXXXb

Le conflit devient inévitable si on superpose les deux historiques.
Figure 4

a::X
b::XX
c::XX0b
d::XXXX0XXb
e::XXXXXXXX0XXXXXXb
f::XXXXXXXXXXXXXXXX0XXXXXXXXXXXXXXb

Au temps b et a, nos racines d'idées sont en conflit (rouge), et au temps c, la proximité peut être suffisamment troublante pour être appellé zone grise.
Une idée ne flotte jamais seule, des bouts viennent de partout et il est rare qu'on ne puisse pas trouver une origine quelque part. À ce jeux, il est clair qu'une entreprise est en mesure d'écraser un individu sur son chemin. L'employé ne peut pas gagner.

  • En Amérique, terre des brevets sur tout, où Bezos a breuveté le one-click tm, cette logique s'applique déjà. J'ai travaillé dans une petite compagnie innovatrice qui a eu une idée qui ressemble au b et il y avait une compagnie américaine qui possèdait un brevet sur A. Sa chaine causale et la nôtre se croisait. Devinez qui a gagné.

Expression et transformation de la connaissance

J'exprimais à la fin de mon billet précédent que la nature même du développement d'une connaissance passe par un processus d'expression et de transformation.

Prenons le temps de préciser. Mais cette fois-ci avec l'optique d'expliquer en quoi le carnet (le blog) y est concerné.

(Je m'inscris comme annexe à une excellente conversation sur la négociation de sens poursuivit entre Mario et Stéphane. On y abordait le fait que le carnet ne permet pas spécifiquement la négociation de sens ni la coconstruction de sens. Négociation s'entend comme tractations discursives entre intervenants sur le sens à donner à un concept en émergence. Coconstruction serait la participation entre ces intervenants pour faire émerger le sens.)

J'avais précédemment abordé cette question pour les wikis. Je concluais que la conversation carnetière, n’est pas qu'un transfert d’un message, il est le lieu d’une fabrication cognitive du sens. Il est temps de m'expliquer.

Le processus rédactionnel contribue au développement de la compréhension.

Le carnet, donc, dans ce cadre représente un excellent outil. Mais le carnet favorise deux approches différentes chez les individus : le processus d'expression des connaissance et le processus de transformation des connaissances.

Le processus d'expression des connaissances.

Ce processus produit un contenu à partir de source externes (d'autres blogs) ou de thèmes personnels. Ce traitement s'apparente à coucher sur le papier (ou sur l'écran) ce que l'on sait. C'est la note. La plupart des billets dans la blogosphère ne sont que des transmissions de connaissances. Outre l'apparence d'accumulation d'information, elle exprime un état plus qu'une construction de la connaissance. Ces textes semblent réfléter l'ordre dans laquel on pense les choses, sans planification préalable.

On écrit alors ce qui est le plus facile à exprimer: c'est un moyen le plus efficace de rédiger un blog. Rappellons que les principaux impératifs perçus du carnet sont l'urgence et la fréquence. Si les connaissances d'un individu sur le sujet sont cohérentes et organisées le carnet en général est considéré de bonne qualité. Mais on ne peut proprement parler d'amélioration de la Connaissance (C majuscule), mais on serait en droit de dire qu'il développe la connaissance (petit c) d'un individu (du moins dans le sens d'une mise à jour des informations).

Le processus de transformation de la connaissance.

C'est un processus de découverte où le chaos recule et la compréhension augmente : construire un argument c'est diriger sa pensée de façon interactive entre les problématiques rhétoriques (comment le dire) et ceux de la connaissance (de quoi on parle). On améliore ainsi à la fois l'expertise rédactionnelle et la compréhension du thème à taiter.

1. Écrire pour défendre une position, si elle entraîne une recherche pour étayer les faits, permet de découvrir la pertinence de ces derniers ou réaliser que nos croyances son injustifiées.

2. Résumer un texte amène l'auteur à une analyse plus critique des connaissances en cause.

3. Construire son texte entraîne la découverte de relations entre sous-thèmes jusqu'à lors insoupçonnées.

4. Le besoin de rendre le texte intéressant pour les lecteurs entraîne un questionnement qui n'existe pas dans un écriture diariste.

5. Le choix même des mots incite à un approfondissement des concepts abordés dans le texte.

(Inspiré de Literate expertise De Scardamalia & Berieter 1991, in Piolat, A. & Pélissier, A. (1998). La rédaction de textes : approche cognitive. Paris : Delachaux et Niestlé.)

L'effort directement impliqué dans la rédaction est proportionnel au développement de notre propre connaissance. Une expertise se forme, ce que n'offre pas la simple transmission.

L'apport des carnets à la construction de sens.

Le carnet est l'outil idéal pour ces deux processus car il place l'individu au centre du processus d'apprentissage. Nul ne serait étonné de comprendre pourquoi les carnets de transformation de la connaissance soient moins répandu. L'effort cognitif demandé exige un espace horaire suffisant et une disponibilité mentale étendue pour mener le processus à terme. La fréquence de publication s'en trouve affectée.

(Les lecteurs qui se sont rendus jusqu'à ce paragraphe seront heureux d'apprendre que vous devez ce billet à mon petit Arnaud qui m'a réveillé à 3 heures du matin - je vous expliquerai comment je procède personnellement à la rédaction une autre fois, maintenant que vous savez comment elle s'enclenche.)

Mais, étonnamment, cette transformation des connaissance n'apporte pas seulement des avantages individuels mais aussi collectives : par son engagement à vouloir rendre compréhensible son texte, l'auteur participe à la construction du sens collectif. Il poursuit le but de démontrer que son point de vue apporte une amélioration à une question donnée.

Le carnet n'est certes pas un outil formel de coconstruction de sens, mais épistémologiquement parlant, elle produit le même effet.

Dans ce sens, écrire modifie ma pensée, améliore celle des autres et augmente la connaissance générale. La charte du KM (voir mon billet à ce propos de cet extreme KM) m'inspire de la crainte car ce processus de transformation de la connaissance m'appartient en propre. Elle s'opère sans que je le sache, même si l'effort est bien réel. Il n'existe plus d'espace privée si le processus cognitive lui-même fait partie de la clause du contrat de l'employé : Sartres disait à la fin de sa vie, lorsque sa vue baissait, que ne pas pouvoir écrire c'est ne pas pouvoir penser. À moins d'inclure dans la charte l'égalité des droits entre le knowledge worker et la société quant à l'usufruit de la connaissance tacite résultante.

AJOUT à 22h00:
Cette "topologie" des billets de weblog a laissé dans l'ombre le biais que crée l'outil. Par sa simplicité de publication, le blog favorise les textes improvisés de transmission de connaissance. Par sa structure en mode chronologique décroissant, il favorise la nouveauté au détriment d'une lente réflexion ou de récurrentes révisions (dans la rédaction de texte et dans le choix des hyperliens). Ce biais favorise nécessairement certaines disciplines qui subissent des changements considérables (SEO, folksonomy, social sofware) mais pose des difficultés pour l'étude en sciences humaines, en pédagogie et en science sociale. Ce qui explique l'impression d'évanessance des gens de ces disciplines, que la nature de l'interaction accentue comme le souligne Stéphane.
---
On lira avec profit: RÉDACTION DE TEXTES. ÉLÉMENTS DE PSYCHOLOGIE COGNITIVE de Annie PIOLAT & Jean-Yves ROUSSEY

On parcourra avec intérêt le résultat dans Google Scholar de : redaction textes approche cognitive

Extreme KM

Martin Roulleaux Dugage s’avance sur un terrain délicat : il propose une charte du knowledge management, où l’employé (principalement) se retrouve forcé contractuellement à transférer sa connaissance à l’entreprise qui l’engage.

(Il avait écrit le mois précédent sur son blog anglais un texte précurseur : Blogging to become a legal obligation?)

De quoi s'agit-il?
C’est, ma foi, ce que j’appellerais du extreme KM, que je résume grossièrement ainsi (lire le texte complet de Martin Dugage ici):
  1. L’employé est tenu de conserver une trace écrite;

  2. Toute communication personnelle doit emprunter un canal séparé;

  3. Toute propriété intellectuelle personnelle doit être hébergé à l’extérieur;

  4. Tout employé doit être authentifié;

  5. Tout contenu doit être accompagné de metadonnées;

  6. Tout employé doit répondre de ses communications sur demande.


Cette approche autoritaire possède certains attraits rationnels :

- la maîtrise des réseaux de circulation de l’information en forçant, notamment, l’employé à laisser des traces ( mais ce n’était sûrement pas le même sens que ytsejamer donne à 'laisser des traces') et

- celle de devoir de répondre aux questions de l’entourage (mais ça non plus ce n’est pas ce que Mario appellerait la négociation de sens)

Ce knowledge activisme (mais ici, vraiment, pas dans le sens que l’entend Sébastien) donne un avant-goût de ce que sera le KM dans les entreprises privées dans quelques années. Frissons garanties.

Martin Dugage écrit: "J'ai bien conscience que ma prose n'est sans doute applicable ni dans le cadre des règles de droit actuel (...) ni dans l'état actuel de diffusion des technologies de gestion des droits d'accès et de gestion des métadonnées. Il n'empêche que je pense que c'est dans ce sens qu'il faut aller.
(source)"
Je ne saurais trop recommander un principe de précaution en ce domaine.

C'est qu'ici il y a matière à réflexion (il est clair que le débat se poursuivra et il serait hors contexte de le rejeter du revers de la main). Or il m'apparaît que l'aspect techno-juridique cache une réalité de la cognition humaine et sociale qui pourrait rendre irrécevable, d'un point de vue humaniste, la mise en place d'un esclavagisme intellectuel au profit des corporations - ne nous leurrons pas, la charte de Martin s'adresse aux seules compagnies qui pourront faire du data mining sur le déluge de données qui découlera de sa mise en place !

Ce qui fascine en même temps dans cette charte, c'est l'application d'une gestion formelle de la connaissance, basée sur une règle simple : toutes les communications sont ouvertes. Détournement du côté noir du 'social software' et autres technologies collaboratives en quelque sorte, car il n'est pas dit que le tout profitera à l'employé (une charte du knowlege work serait à dresser).

Évidemment, le KM, permet (et, dans ce sens, l'employé y gagne):

  • une rétroaction rapide

  • l’interrelation entre les chercheurs

  • et valorise les processus de recherche

Mais la finalité derrière cette charte réponds à une rhétorique marchande qui glace mon ardeur : à qui appartient les connaissances générées en milieu de travail ?

J'entends ici que la question n'est pas triviale:

  1. que considère-t-on comme connaissance (le savoir tacite?),

  2. que veut dire générer de la connaissance (le processus de faire de nouveaux liens? d'identifier une information comme utile) et

  3. où s'arrête le milieu de travail (une idée sous la douche? un coup de téléphone dans le trafic?)
Limites et critique du extreme KM

J'avais souligné il y a quelques mois les propos de Larry Pruzak sur le partage de la connaissance : "one of the things that they often try to do in big companies is to organize communities, force them together."

J'imagine bien que la charte demandera nuance et qu'il n'y a pas d'intention maléfique sous-jacente (ce serait le contraire de que Martin exprime sur son blog depuis le début), mais je ne peux m'empêcher d'y voir un possible dérapage à la fois vers (a) un déséquilibre qui renforcera davantage le système au détriment de l'humain ainsi que vers (b) une incompatibilité fonctionnelle avec le processus cognitif de création de connaissance, à l'encontre d'une certaine culture de réseau émergente.

Premièrement, (a) il me fait mal au coeur de savoir qu'alors des expériences comme celle de l'Institut St-Joseph cherche à faire avec les carnets ne serait que des matrices à fabriquer des knowledges workers pour leur exploitation future sur le marché du travail.

Deuxièment, (b) la nature même du développement d'une connaissance passe par un processus d'expression et de transformation qui ne se contrôle pas aisément. Je parle ici en particulier de la communication écrite, qui est un phénomène connu en psychologie cognitive : la pensée se construit par l'exercice de l'expression.

Précisons brièvement ce deuxième point (car je suis conscient que le propos demandera d'avantage de précisions).

  • Le besoin de rendre une communication claire et explicite demande d'être soi-même clair et concis dans ses pensées, nous sommes porté à réfléchir et retravailler notre pensée jusqu'à la complète compréhension de la problématique. Jusqu'ici, tout va bien. Mais alors, pour qu'elle se réalise, cette pensée, elle devra être verbalisée ou écrite. Et à ce que je sache, dans un réseau où joue la sérendipité, la transparence est de mise. Or toute idée exposée (même personnelle ou involontaire) sur un lieu de travail deviendrait la propriété de l'employeur, l'employé n'ayant pas les capacités cognitives d'arrêter le flot de sa pensée ni de conserver celle-ci sous formes d'idées non extériorisé le temps de s'extraire du territoire légal.
En d'autre temps on appelait ça le viol de la pensée.

---
Post scriptum 28 janv.:
- j'ai développé davantage sur ce que j'entends par expression et transmission de la connaissance
- Martin Dugage, auteur de la charte du KM, a commenté ce présent billet sur son blog.
Ajout 7 septembre 2005:
- Martin Dugage rend disponible une charte du KM

La révolution orange passe par le blog

Viktor Iouchtchenko, le nouveau président ukrainien a son blog (et un fil web). En cyrilique. (Via Scripting news)

La révolution orange gagne le web. Mais, ici, au Québec, on a encore des croutes à manger.

MoonEdit

MoonEdit. On dirait un Wiki en mode Turbo ! Le genre d'outil pour écrire un compte-rendu de conférence à plusieurs mains.

1. Multiple usagers simultanés modifiant un texte en temps réel.
2. Aucun upload ou d'échange de fichier : comme un wiki on travaille tous le même document mais en même temps.
3. Les curseurs sont visibles (et audibles) en même temps (avec couleurs différentes pour le texte modifié).
4. Pas de temps d'attente (c'est bâti sur un moteur de jeu vidéo.
5. C'est Window et Linux.

Imaginez cet outil incorporé à un wiki...

(Via LudoBlog)

Google et la recherche (pas si) avancée

Intéressant billet de Jean Véronis : Google perd la Boole (et un excellent jeux de mot)

Il épingle un curieux comportement de Google : Le nombre de pages qui contiennent soit le mot "Chirac" ou soit le mot "Sarkozy" (le booléen 'OU'), ou les deux (le booléen 'ET' où les deux mots doivent être présent dans la page), devrait être au moins égal au nombre de pages contenant minimalement le mot "Chirac", or il démontre qu'il est inférieur à la moitié.

C'est à dire qu'il y a plus de pages qui contiennent le mot "Chirac" que de page qui contiennent "Chirac" OU "Sarkozy" (or ici le OU ne devrait pas affecter les termes de la requête)

"Bien sûr, je sais que les nombres retournés par Google sont des approximations (d'ailleurs le moteur précise bien environ x résultats), que les valeurs peuvent légèrement varier en fonction des "centres de données" qui traitent la requête et qui peuvent varier d'un moment à l'autre. Ces raisons pourraient expliquer de petites différences, mais pas des différences du simple au double." (source)

Le problème est troublant pcq il touche la crédibilité de la requête (la moindre des chose à laquelle on s'attend c'est bien qu'un programme reste logique). Le cas pourrait être bêtement technique s'il ne concernait les pages de queues (qui se soucient d'aller voir la page 200 000 d'une requête?).

En reproduisant la requête de mon côté de l'Atlantique, j'ai remarqué que les 4 premiers liens retournées restaient les mêmes (Chirac possède davantage de Google Juice que son rival).

Mais le 5ieme varie:
Pour 'Chirac' seulement on trouve le musée du président Jacques Chirac.
Pour 'Chirac' OU 'Sarkozy', on trouve chiracaveclafrance.net - Dating info. This website is for sale! (no follow). Un misérable site de squat. Mon étonnement vient du fait que ce site a créé son PageRank avec le mot 'Sarkozy' (sinon il n'apparaîtrait pas là).

(Mise à jour 25 janvier:

Ce matin le ranking n'est plus tout à fait pareil. 'Chirac' OU 'Sarkozy' retourne en pole position un site d'emploi CHIRAC (Concept Hypertexte Internet Rassemblant les Acteurs contre le Chômage) laissé à l'abandon depuis plus de 6 ans. Et le site de squat dont je parlais est repoussé un peu plus loin (7 ou 8ième place). Mais ce site de squat est toujours avant la page officielle de Sarkozy à l'assemblée nationale. Le problème reste entier car si on fait une recherche sur Sarkozy seulement le site de squat et le serveur CHIRAC disparaissent de la liste... Or il est clair que ces 2 sites sont associés au mot clef Sarkozy, donc devrait être là pour uen recherche isolé sur ce mot...)

Ce dernier détail, même s'il n'étonne plus les experts en positionnement, me laisse songeur sur la qualité des résultats de Google. Sommes nous en train de voir les limites de l'algorithme de Google, parasité par son propre succès? C'est à dire que l'observateur Google est en train de modifier ce qu'il observe (les sites web)? Qu'un site de squat monte aussi haut en dit long sur la facilité de détourner l'algorithme à son avantage.

Depuis l'avènement des blogs, on dirait qu'il y a quelque chose qui est débalancé dans le pagerank... Le Sandbox serait-il une réponse que Google nous prépare?
---
Ajouts 26 janvier 2005
Pour des exemples de manipulations du Pagerank:
-Dark SEO Team :Bilan du projet pagerank 10
-Pandia Search Engine News : Spammers hijack web site listings in Google
-Tonyspencer : tracker2.php Pages Hijacked via HTTP 302 Redirect Google Bug
-Lori : Stop Redirects from Hijacking Web Page PR

Pour comprendre le PageRank :
- Initiation de WebRankInfo (en français)
- PR Explained by WebWorkShop (in English)
- PR calculator (advance explanation) by Mark Horrell

No Follow

Initiative unilatérale, il y a deux jours, des grands moteurs de recherche et des logiciels de blog: pour limiter le "comment spamming" l'attribut rel="nofollow" du tag hyperlien sera utilisé.

Si un moteur de recherche rencontre un hyperlien qui possède cet attibut, le moteur n'incluera pas le lien dans son algorithme.

a href="http://www.w3.org" est un lien que le moteur suivra.
a href="http://www.w3.org" rel="nofollow" est un lien que le moteur ne suivra pas.

"This isn't a negative vote for the site where the comment was posted; it's just a way to make sure that spammers get no benefit from abusing public areas like blog comments, trackbacks, and referrer lists.
(source)"


Autrement dit en ajoutant à vos templates cet attribut aux hyperliens de vos commentaires, vous indiquez que le lien n'a "pas été vérifié" (ou "pas approuvé").

Celà n'empêchera pas le spamming en tant que tel, mais ralentira les hardeurs à ceux qui cherchaient à remonter leur ranking via les commentaires.

Les logiciels de blogs vont offrir de nouvelles versions ou des patches pour automatiser ce nouvel attribut pour les zones "publiques"...

Les moteurs appliquent déjà cette règle ou d'ici peu

Lire : Google, Yahoo Msn Search, Six Apart, eWeek

Dans la zone commentaire, cette initiative tombe sous le sens pour limiter les comments spamming, mais cela va plus loin qu'on l'imagine si on l'utilise autrement.

Ce que je remarque c'est que rel=nofollow deviendra de facto un moyen de distinguer les hyperliens positif et négatif : dorénavant vous pouvez pointer vers le site que vous détestez sans pour autant faire monter son ranking dans les moteurs de recherche : on peut alors pointer sans approuver ce que l'on pointe.

Évidemment rien n'empêche quelqu'un de suivre le lien, mais l'hyperlien n'est plus exclu de la rhétorique de la discussion : un parti politique peut enfin pointer vers son rival sans lui donner du poids (pour sa visibilité) dans les engins de recherche.

Vous pouvez ainsi sortir du paradoxe hypertextuel où vous deviez pointer vers un site populaire pour décrier justement sa popularité. C'est l'anti Google-bomb.


---


AJOUTS 17h00:
De bonnes discussions sur l'effet pervers que celà va entraîner:

  • Blog and blues laisse sous-entendre que c'est une réaction des moteurs de recherche pour limiter la "surpondération" des blogs.

  • François Palaci trouve que l'on casse la relation de sens entre les deux documents liés.

  • Ici on laisse entendre que celà aura des répercussion sur les 'vraies' commentaires - car si on en laisse pas nécessairement pour se faire du Google Juice on s'attend à en retirer quelque chose au moins.

  • Chadwest précise que n'arrêtera pas les spammers mais seulement les moteurs de faire leur travail de suivre un lien.

  • D'autres discussions via Technorati sur le .


Je note en tout cas que quelque chose s'est passé cette semaine qui a une portée plus importante que l'on peut imaginer : le puissant lobby de ceux qui contrôlent l'accès au contenu d'Internet vient de décréter que les zones publiques de commentaires sont "untrustable", seuls ceux qui sont "propriétaires" de sites auront le droit de pondérer leur liens (création de 2 classes d'internautes); peut-être aussi, l'utilisation de nofollow permettra à certains de contôler les hyperliens (taxe pour enlever le nofollow dans les cas extrêmes) pour détruire la force du réseautage (les journaux pointant en nofollow vers leurs sources)...


AJOUTS 22h15:
Voilà déjà le premier exemple d'hyperlien nofollow pour pointer vers un site détesté ("I got an excuse to use the rel="nofollow" attribute on a link for the first time. No juice for you!"). L'anti Google-Bomb commence à se répandre.

Anil Dash illustre très bien pourquoi c'est un changement de paradigme pour les engins de recherche :
-PageRank, when created, didn't assume that content on a web page, especially links, would be generated by someone other than the publisher of that page.
-PageRank was not based on the assumption that the rankings would have monetary value.
- And PageRank is based on the assumption that site editors choose their content, particularly their links, based primarily on merit.

(source)
Anil démontre que l'algorithme original comporte une faille : il assumait que les liens sont pondérés par un "propriétaire". Le nombre croissant de commentaire causé par le raz-de-marée de nouveaux blogs déstabilise statistiquement la "qualité" du moteur de recherche.

Desi Geek raconte l'histoire du "commentaire" et pourquoi le nofollow peut nuire à l'écosystème des blogs.

Six Apart offre une bonne introduction au nofollow.

Eurekster : la recherche partagée

Il y a bientôt un an Robin Good proposait le concept de Newsmastering, où la recherche sur le web cesserait d'être isolé ("a one-time shot") pour enfin venir renourrir le web : le "newsmaster" filtrait/mixait les fils pour isoler/peaufiner une recherche sur le web en temps réel et la faire partager à tous.

Un pas a été franchi en cette direction avec la création de Eurekster SearchParty™



(Remarquez ce côté vieillot apporté par le "tm", artéfact d'une autre époque)

Eurekster est un moteur de recherche basé sur des thèmes créeés par ses utilisateurs. L'information retournée par le moteur peut être pondérée par l'usager en temps réel afin faire remonter l'information qu'il juge pertinent.

Les communautés de pratique peuvent s'ouvrir un "Searchparty" (je traduirais par un "filtre") pour infléchir davantage les résultats selon leurs intérêts (les medecins, les professeurs, les militants de l'aprentissage, nouveaux parents, voyageurs, agents immobiliers, etc).

"Eurekster ranks your users' favorites. One of your users does a search and finds a useful link on the third page of results. The user runs the same search two months later and that useful search result is now at the top. Better yet, when another member in your user community SearchParty finds a great result, all your users see what they found in the top ranked items too!"

Le résultat pondéré est représenté par un [e] afin de bien identifier un lien qui a été "remonté". Un pas très intéressant dans la direction d'une (re)prise de contrôle par les usagers des données sur Internet. L'idée de partage continue de faire son chemin...

(via Fundsachen )

Babelplex

Vous désirez faire une recherche sur la 'gestion de la connaissance' sans vous couper des résultats sur le 'knowledge management' ?

Vous pouvez maintenant faire une recherche dans une langue et la requête est traduite dans une autre langue (français et anglais, chinois et anglais, français et grec, hollandais et français, etc)

Voici: www.babelplex.com

"Ce site combine la technologie de traduction automatique de Babelfish (Systran) et un moteur de recherche (Google, Altavista ou Yahoo! au choix). Il permet d'effectuer des recherches translingues." (via AixTal)

La requête est traduite en temps réel et l'écran se sépare en deux pour montrer les deux pages résultats, chacune dans leur langue.

Ce qui est intéressant, ici, c'est que nous n'avons pas affaire à la fonction booléenne OU traditionnel. Car 'gestion de la connaissance' OU 'knowledge management' donne des résultats où le français est relégué dans le xième écran (les algorithmes défavorisent de facto les autres langues que la lingua anglica.)

En séparant les résulats, on permet de pondérer les résultats en fonction des langues, et ce, en une seule requête (au lieu de faire deux requêtes distinctes). Intéressante initiative...

Blogs : l'heure du décryptage

Les médias traditionnelles se réveillent au lendemain du jour de l'an avec une gueule de bois. "Nous avons reçu une formidable vague médiatique".

«Blogs» : l'heure du décryptage est le titre d'un article de Laurent Gervereau dans le Figaro d'aujourd'hui. "Elle nous pose beaucoup de questions centrales dans une période de bouleversement des médias".

L'article en question élabore sur l'arrivée des blogs sur la scène médiatique, vu de l'intérieur de l'institution. Plus tôt cette semaine, je me suis risqué (expression de Mario ;-) à donner le mien, vu de l'extérieur, sur ce que j'ai appellé la société des chroniqueurs, alors maintenant, voyons voir...

Le blog, aux yeux du journaliste, "d'abord journaux intimes sur le Web, puis, pour partie, volontés de faire passer des infos différentes", sort gagnant pour ce qui est de la couverture du triste événement en direct et "[remets] en cause ce qu'est la notion d'actualité, insistant sur tel ou tel phénomène, donnant la parole à des personnes hors système, hors territoire, une révolution mondiale de l'information aura lieu."

"Nous savons que ce qui circule sur la planète est produit essentiellement par l'Amérique du Nord et l'Europe de l'Ouest. En fait, cette partie du monde se regarde et regarde les autres" rajoute-t-il.

Il insiste particulièrement sur les blogs vidéos amateurs ("nous devons surveiller l'assaut des premiers «vlogs»"). Effectivement, il m'apparait difficile de ne pas voir dans la captation et la diffusion d'images par des amateurs une sérieuse menace pour les médias télévisuels. Le nombre de vidéos disponibles suite au 26 décembre ne laisse pas d'impressionner.

"Le plus difficile sera pour la télévision, qui perdra sa fonction régalienne et subira des contestations en direct.". La décrédibilisation des médias naît en effet du constat effectué par tout ceux qui maîtrisent un domaine d'expertise et qui l'estiment mal couverte : relégués jadis comme spectateurs impuissants, les nouvelles technologies leur permettent aujourd'hui de communiquer leur connaissance et leur opinion à qui veut les entendre.


Remarquez, son constat est lucide. Mais j'aimerais le rassurer que l'accès aux vidéos elle-mêmes ne sont pas la menace appréhendée. Ni l'accès à la haute vitesse nécessaire pour les télécharger. Le phénomène existe déjà depuis 10 ans et le mal négligeable créé jusqu'à maintenant restera sans effet : en "broadcast", un serveur pris d'assaut s'écroule; alors qu'une chaîne télé, elle, rayonne qu'importe combien la capte.

Rappelez-vous un certain 11 septembre. La télé, reine de l'image, était regardée par tous. Alors que le web s'étouffait sous l'avalanche, les sites web dégarnissaient leur page d'accueil pour ne conserver que le stricte nécessaire.

Qu'y a-t-il de différent aujourd'hui?

Certes l'impact concerne un plus grand nombre et le territoire circonscrit est sensiblement plus vaste. Mais ceux qui se sont mis à la recherche des vidéos ont vu quelque chose de nouveau : BitTorrent, le logiciel pair-à-pair de téléchargement. Même si ce n'est qu'un "qu'est ce que c'est que ça ?" lancé de la part des internautes lambda, BitTorrent a effectué son premier contact avec le grand public. Comme les blogs durant l'invasion de l'Irak, le grand public a goûté à une nouvelle technologie, même si il n'en saisit pas toute la portée.

Et qu'a-t-il de menaçant pour l'institution télévisuelle, ce logiciel? Voilà : plus il y a de gens qui se branche sur un serveur pour télécharger le même vidéo, plus BitTorrent télécharge rapidement grâce à un dispatch intelligent entre tous les pairs connectés. Vous voyez le portrait : la télé pert son monopole de diffusion en masse d'images. Les plus malins ont déjà compris les applications pour le piratage d'émission télé ou de films.

Alors ce qui a échappé à notre journaliste en fixant les blogs comme une menace à surveiller, c'est l'entrée sur la scène de BitTorrent. Parions que dans 1 an ou 2 il y aura un article intitulé «Bittorrent» : l'heure du décryptage...


---
Pour en savoir plus sur BitTorrent.

Mes commentaires sur d'autres carnets

Voici un bon moyen pour garder une trace de mes plus récents commentaires sur d'autres carnets, questions ne plus m'éparpiller dans la blogosphère...


Blog, journaux, objectivité et partialité

Ignacio Ramonet a écrit dans le Monde diplomatique de ce mois:
"Il y a aussi le phénomène des « blogs », si caractéristiques de la culture du web, qui ont explosé partout au cours du second semestre 2004, et qui, sur le ton du journal intime, mélangent parfois, sans complexe, information et opinion, faits vérifiés et rumeurs, analyses documentées et impressions fantaisistes. Leur succès est tel qu’on en trouve désormais dans la plupart des journaux en ligne. Cet engouement montre que beaucoup de lecteurs préfèrent la subjectivité et la partialité assumées des bloggers à la fausse objectivité et à l’impartialité hypocrite d’une certaine presse." (Source)
(c'est moi qui souligne).
Pas plus tard que ce matin, Armstrong Williams, un commentateur de la télévision américaine avoue avoir touché 240 000$ du président Bush pour faire la propagande d'une réforme.

January 9, 2005

Dear readers:

In 2003 I agreed to run a paid advertisement on my syndicated television show promoting the Department of Education's No Child Left behind Act. I subsequently used my column space to support that legislation. This represents an obvious conflict of interests. (suite)
J'ai toujours envié le Monde diplomatique de pouvoir écrire à l'avance des choses si actuelles.

La société des chroniqueurs

Les carnetiers ont été nommés "People of the year" par ABC's news.

Hum. Bien content de voir que le phénomène prend de l'ampleur, car cela accéléra la transition vers le nouveau web (les blogs sont les chevaux de Troie du RSS). Mais je me demande ce qui a motivé ce choix.

Pourquoi cette année, pourquoi maintenant?


Cette année, parce qu'elle en était une présidentielle (pour les Américains) : "(...) for the first time, bloggers were permitted to cover the national political conventions firsthand. Bloggers have taken the lead over traditional media on a number of stories (...)".

En ce moment, parce que les médias digèrent encore le coup du Tsunami : "This week, their influence has become readily apparent. Dozens of bloggers have been filing firsthand reports from the areas devastated by southern Asia's deadly tsunamis."

Sur le même thème, François Guité rajoute : "En plus de décrire les événements locaux dans un continuum espace-temps, les récits gagnent en instantanéité tout en évitant le journaliste interposé."

On reconnaît là la courte vue des médias de masse où tout se résume à l'instant même (ou la demi-seconde qui précède). D'ailleurs la preuve en est que la fonction de communication qui attire l'attention des spécialistes des communications sur les blogs se résume à son immédiateté:

"Some of the most compelling images of 2004 found their way to blogs first, from the Florida hurricanes to the war in Iraq. It was a blogger who got the first photographs of coffins carrying U.S. soldiers arriving in the United States from Iraq." (C'est moi qui souligne).

On pourrait rajouter les récits à la première personne de phukettsunami.blogspot.com .

La symbiose semble parfaite entre les blogs et la télé : l'un et l'autre se nourrissent dans l'exposition des scoops et le manque de recul. Nous sommes entrés dans la société des chroniqueurs.

Écrire dans l'immédiat

Je lisais récemment dans le Monde 2 que la particularité des carnets était d'être "écrit à chaud". Il n'est donc pas étonnant que la blogosphère donne le pouls d'une population, pour le meilleur ou le pire. Dans ce sens, les blogs se font intégrer dans le spectacle du monde (au sens qu'y donne Guy Debord).

Les médias ne semblent jamais expliquer l'extrême rapidité de la propagation de l'information dans la blogosphère qui repose sur le RSS. Un blog ne sera jamais autre chose qu'un micro dans une salle vide sans le fil web. C'est lui qui permet de fairecirculer l'information. Or, on sélectionne les fils en fonction de ses désirs/besoins/envies. Grosso modo, nous trions ce qui entre. C'est le biais cognitif, le filtre obligatoire pour éviter la noyade. Il n'est pas étonnant que les médias sélectionnent eux aussi les fils qui alimentent leur vision du monde comme accumulation de spectacles. Dans ce sens, alors, ce n'est pas la blogosphère qui se fait récupérer, c'est la vision déformée des médias qui la tronque.

Écrire à chaud

J'ai fini par accepter l'idée. Le carnet s'écrit à chaud (ne sous-estimez pas les implications d'une telle assertion). Mes billets ne s'écrivent pas sur une longue période, elles ne sont pas relus par des pairs, ni supportés par des références littéraires approfondies, ni minutieusement corrigés après coup pour atteindre la perfection.

Ne nous trompons pas : cela donne des grands textes . Mais ils ne sont pas du même genre que les textes académiques. Ils n'en ont ni la prétention, ni les moyens. Même s' il y a des exceptions notoires (pensons à l'excellent blog de Dave Pollard "How to save the world").

Le genre limite l'expression de la pensée : en ce sens, la blogosphère n'est pas la noosphère. Seulement une sous-partie. Laquelle? En fait, cela dépend du "déclencheur" de la rédaction du billet.

On écrit parfois à chaud selon deux vecteurs:

(1) soit sur un événement qui surgit,
(2) soit sur une idée qui germe.

La première découle du journalisme-reporter. Et ce sont ces carnetiers qu'ABC récompense cette année. L'évidente filiation ne doit toutefois pas cacher qu'il s'agit souvent d'opinion et non de journalisme. L'évènement, pouvant être, ici, autant une juvénile excroissance téguménique en saillie (parfois appelé bouton d'acné) qu'un raz-de-marée, est retransmis et commenté.

La seconde découle de l'écrivain-essayiste, voire de la philosophie. Ce sont des questionnements de valeurs subjectives non associés à un événement, mais bien à une pensée. Le carnet dans ce cas relate chronologiquement l'évolution d'une formation. Ces idées peuvent varier de la façon de gagner à un jeu vidéo jusqu'à la recherche empirique du sens.

Les nouveaux chroniqueurs

Tous les deux font parties des nouveaux chroniqueurs de la connaissance (avec ou sans majuscule). Ils oeuvrent à construire une nouvelle institution contemporaine du savoir. À ce titre, elle serait en opposition avec le savoir scientifique (celle de la recherche et de l'enseignement -nous entrerons dans ce débat une autre fois).

Ce savoir appellé savoir narratif a trouvé son terrain fertile : la blogosphère (du moins celle qui s'écrit à chaud). La tradition des récits (appelé au goût du jour StoryTelling) retrouve un lieu pour exister formellement.

La société des chroniqueurs véhicule des narrations bien particulières qui déterminent à la fois ce qui est dit et ce qui peut être connu (contrainte de l'outil et du processus) et qui appelle une toute nouvelle façon de transmettre la connaissance. Voilà la nouveauté, voilà ce qui va changer le monde...

Dictionnaire auto-suggestif

ObjectGraph est le premier "auto-complete dictionary" à ma connaissance! (Merci François !)

Wow !

À la manière de Google Suggest, vous tapez un mot et un liste de suggestions apparaît jusqu'au mot choisi. À la différence que la définition apparaît elle aussi en temps réel. Gratification instantanée!

Tout simplement marvelous (dictionnaire en anglais seulement, si vous voyez ce que je veux dire).

Pour les geeks,
il y a une page qui explique comment ça fonctionne. C'est le retour de l'enfant prodigue : Javascript refait une entrée fracassante ! Nous sommes loin des alert et des document.write :

"As you type a word in the textbox, a javascript event fires and a HTTP GET request to the ASPX page. The response from the ASPX page is simply displayed in a div tag under the textbox. The page is not refreshed/reloaded for every keystroke as everything is done by the javascript in the page. The main javascript object that allows us to do this is XMLHttpRequest. This is supported by IE 5.0 +, Mozilla 1.0 + and Apple's own Safari 1.2 + "
(source linkfilter )

---
En passant:
Pour Google Suggest, voici comment ça fonctionne
Pour en savoir plus sur le XMLHttpRequest

Ajout du 10 janvier 2005:
Réflexions pour la bibliotheconomie
Un truc pour dans un SIGB au niveau des autorités (BiblioAcid) (via PluriTAL)
Il faut avoué que cet outil offre ce que l'on pourrait appeller une recherche sans requête. Du point de vue de l'usager, c'est ce que l'on peut appeller de la recherche assistée : l'outil aide en temps réel (et non pas en dialogue discret) le raffinement du terme recherché.

You send it

Un fichier trop gros pour envoyer par courriel? Essayez www.yousendit.com.



Pas de compte à créer, pas de mot de passe à se rappeler, pas de logiciel à installer , pas de boîte remplie ni de serveur qui s'étouffe : youSendIt vous permet d'envoyer un fichier jusqu'à un gig (oui, oui, 1 Giga octets).

C'est simple : (1) entrez l'adresse courriel du destinataire et (2) uploadez votre fichier, (3) cliquez sur envoyer. Le destinataire a 7 jours pour downloader le fichier.

Vous ai-je dis que c'était gratuit?

(via Pisani)

PS: évidemment, utilisez votre courriel dont le mail server possède un filtre de spam. Rien n'est totalement gratuit...

Perdre ses mots

Préoccupant problème : il m'arrive parfois de (re)trouver mes commentaires dans des endroits dont j'avais oublié jusqu'à l'existence.

Jusqu'à maintenant j'optais pour ce choix quand je voulais commenter un carnet d'un autre:

  • Si je peux relier mon commentaire à des thèmes que je construis sur mon carnet, je crée alors un billet sur mon carnet mais je joue du trackback pour conserver le fil de la conversation.

  • Si le commentaire ne peut être relié de façon satisfaisante (ou s'il est trop court) par rapport à mes thèmes de carnet, je le laisse sur le site en question.

La pensée "perdue" pour ma cognitique personnelle est transformée en don pour mon réseau de confiance. Et éventuellement le retour est plus grand que ce que j'ai "perdu".

Via Remolino qui via Mario qui via Sébastien qui via Michael Lenczner, j'ai découvert enfin le moyen de garder trace de mes commentaires sur le carnet des autres. Maintenant, grâce à del.icio.us, je ne perds plus mes mots

Ce 'commentBlogging' se trouve aussi sur ma page d'accueil maintenant.

++Mise à jour du 6 janvier++
Sur mtl3p on dit que del.icio.us ne peut mettre 2 fois le même signet : alors comment faire si on met plus qu'un (1) commentaire sur un billet (et que l'on veut faire des entrées différentes dans del.icio.us) si le blog n'offre pas de #anchor?

Et bien c'est simple, ajoutez le à la main ! Dans le champ url de del.icio.us, ajouter "#" suivi d'un mot ou d'un chiffre. Le url est considéré 'différent" par del.icio.us et le blog n'y voit que du feu.


Catégorie thématique

Et dans la même veine (c'est à dire détourner les signets collectifs de del.icio.us pour des raisons personnelles), voilà un mois que j'ai créé sur ma page d'accueil une façon d'avoir des catégories pour mes billets.

J'utilise Blogger comme outil de carnet mais qui n'a malheureusement pas la fonction d'assigner des mots clefs aux billets. Qu'à celà ne tienne, je bookmarke mes billets sur del.icio.us/zeroseconde et je leur donne des 'tags'. Il est possible maintenant de suivre seulement les billets qui sont dans une catégorie qui vous intéresse grâce au fil web.

Les catégories principales se retrouvent sur ma page d'acceuil.

---
Ajout 9 janvier :
Comment marche del.icio.us (par Remolino)
Information routing (Jon Udell's)
Collaborative knowledge gardening (Jon Udell's)