Quelles notions info-documentaires envisager ?
Dans un premier temps il me fallait répertorier les caractéristiques de l’objet d’étude, construire le concept « Google » et ses attributs.
Une définition
Partons de la définition de « moteur de recherche » que propose Pascal Duplessis et Ivana Ballarini-Santonocito dans leur Petit dictionnaire des concepts info-documentaires. Disponible sur le site de Savoirs Cdi.
« Serveur spécialisé permettant l’accès sur le Web à des ressources, à partir de requêtes constituées de mots-clés ou de texte libre et selon différents paramètres.
Ce type d’outil de recherche en ligne explore automatiquement et périodiquement les pages web (et non les sites) et les copie sur des serveurs dédiés. A partir de ceux-ci, des logiciels, appelés spiders ou crawlers, procèdent à une indexation sur tous les mots de la page. Ils constituent ainsi un index qui contient des liens vers les pages web répertoriées.
(...)
Suite à la requête d’un utilisateur, un logiciel crée alors une page de résultats constituée de la recension de toutes les pages web répondant aux critères de cette requête. Chaque résultat présente le lien vers la page sélectionnée et l’assortit d’extraits situant les mots-clés de la requête dans le contexte de la page ciblée. A ce stade, les moteurs réagissent à nouveau de manières différentes, à partir notamment de la stratégie de présentation des résultats que proposent leurs concepteurs.
(...)
Cet ordre d’apparition sur la page de résultats se révèle crucial pour certaines entreprises et secteurs influents (économie, politique, idéologie) et provoque des stratégies de placement plus ou moins répréhensibles (Voir Positionnement payant).
Une typologie sommaire des moteurs d’ordonnancement des résultats fait apparaître deux principaux modes de présentation, l’un opérant au moyen d’un indice de popularité, le second par catégorisation des résultats. »
À partir de cette définition je suggère d’établir une liste de notions qui constitueront le noyau de notre projet d’apprentissage. Je propose une segmentation inspirée des trois étapes du traitement de la requête : la collecte de pages, l’indexation, le référencement/positionnement. Ce découpage correspond d’ailleurs aux étapes répertoriées par Marie-Laure Malingre et Alexandre Serres. La collecte des données et la constitution des index sur le site de l’Urfist de Rennes.
On lira également avec grand profit la description d’un stage récent de l’Urfist de Rennes (28 avril 2008), animé par Alexandre Serres et Marie-Laure Malingre, intitulé : « Moteurs de recherche : sortir de Google ». Le support du stage (en .ppt) est très complet.
A partir de cet examen préliminaire j’en déduis que les notions à aborder peuvent se décliner en : page web, serveur de données, formulaire de recherche, mots-clés, chaînes de caractères, recherche en texte intégral, « spider » (robot de collecte), robot d’indexation, calcul de densité, indice de popularité, classement des résultats, positionnement automatique, positionnement payant, économie des moteurs de recherche.
Le dispositif pédagogique
Il restait à imaginer un dispositif capable d’intégrer toutes ces dimensions tout en éveillant la curiosité des élèves (et exercer leur sens critique).
Je m’orientais vers une séquence de deux heures en classe de seconde (demi-classe) et commençais l’expérimentation dés le début de l’année.
Les premières séances présentaient le modèle suivant : une progression partant d’un questionnement guidé (« maïeutique ») fait de constats et d’hypothèses destinés à progresser dans la compréhension de l’outil.
Déroulement de la première séance
- 1.simulation |
- 2.faire |
- 3.lister les |
- 4.faire |
- 5.la question à |
- 6.une diapo |
- 7.la saisie de |
- 8.à |
- 9.les élèves |
- 10.Pour finir, |
Déroulement de la deuxième séance
- 1.le |
- 2.évocation |
- 3.examen de la |
- 4.examen des |
- 5.les |
- 6.un rapide |
- 7. j’attire |
- 8. pour montrer |
- 9. pour éviter |
- 10.le second |
- 11.pour montrer |
- 12.je mentionne |
- 13.la question |
- 14.la lecture |
Un bilan et des variantes
A l’issue des premières expériences menées avec ce dispositif je décidais de conserver l’entrée en matière c’est-à-dire de faire constater un usage généralisé non-questionné et de démontrer que le choix de l’outil n’est pas déterminé par un jugement portant sur la qualité réelle du moteur mais plutôt sur sa visibilité dans le monde informatique mais également dans le petit monde de l’école.
Démontrer pour convaincre
Je suis de plus en plus convaincu qu’il peut être bénéfique de démontrer aux élèves que leurs pratiques (que nos pratiques ?) sont souvent parcellaires et stéréotypées. D’ailleurs j’ai pu constater que les élèves très actifs en début de séance limitent par la suite le nombre de leurs interventions pour se concentrer sur la compréhension de l’outil. Il faut se garder toutefois de trop insister sur cet état de méconnaissance. Il m’arrive fréquemment de le questionner avec les élèves : comment expliquer que nous ne connaissions pas un outil aussi usuel ? Comment interpréter notre confiance aveugle ?
Pour la partie technique je suggère de montrer des photographies de « Data center » et de serveurs pour que la prise de conscience de la dimension physique du fonctionnement contribue à dissiper la magie de l’outil. De même une visite virtuelle du « Googleplex » fait entrer de plain-pied l’élève dans la dimension économique de la firme.
J’ai personnellement pris pour appui un diaporama destiné à gagner un temps précieux lors de la réalisation de schémas commentés ou de la présentation de données chiffrées. Il me semble que pour ce type de séance dialoguée ce support ne saurait être utilisé de manière exclusivement chronologique. Je n’ai jamais suivi le déroulement des écrans sans rompre la succession initiale pour m’adapter aux rythmes et aux évolutions des séances.
D’autres lancements
Partir de l’énigme posée par la position hégémonique de Google est une entrée en matière qui alerte les élèves et focalise leur attention.
La réflexion (et l’intérêt) peut prendre appui sur la lecture d’articles qui évoquent les mésaventures de Google en Chine : on se souvient que les autorités chinoises ont exercé des pressions pour que le moteur fasse disparaître certaines informations de ses pages de résultats (ex. la répression des mouvements étudiants de juin 1989, place Tian’anmen). Il est alors avéré (aux yeux des élèves) que la source des sources n’est pas aussi impartiale qu’il y paraît. En tout cas l’examen qui leur est proposé par la suite est justifié.
Une bonne écoute
Globalement les élèves ont accueilli très positivement ces séances. Le choix d’un questionnement qui part de nos pratiques réelles semble assez efficace. Il aura fallu insister à plusieurs reprises sur la dimension artisanale de nos recherches sur le Web pour que le dialogue se déroule dans un climat de confiance : il n’est pas question de stigmatiser de « mauvais usages » mais d’installer les éléments susceptibles d’entrevoir les possibilités et les limites de l’outil (une culture de l’information ?). En effet on peut difficilement continuer à dire aujourd’hui que Google ne permet pas de requêtes en langage naturel ou qu’il soit naïf de poser des questions au formulaire (ce qui reviendrait à exclure arbitrairement le référencement des fils de discussion des forums par exemple). Par ailleurs il semblerait que les mots interrogatifs ne soient plus comptés au nombre des « stop-words » (pour l’instant !).
Quelques pistes...
En fin d’année j’ai fait reposer une partie de la réflexion sur l’examen des pages mises « en cache » dont le lien apparaît sur la page de résultat de Google. Non seulement les chaînes de caractères sont colorées sur les pages (ce qui permet d’observer le travail du moteur) mais le préambule de Google précise les modalités et les dates de collecte. Je conseille d’ailleurs aux élèves de consulter dorénavant ces pages pour tenter de comprendre pour quelles raisons le moteur nous les propose.
Il resterait sans doute à explorer un aspect que j’ai personnellement sous-estimé. Certains élèves utilisent le formulaire de « Google images » pour des recherches scolaires qui ne le réclament pas a priori. Ces élèves exploitent le confort visuel conféré par les vignettes des résultats pour contourner la lecture plus ardue des pages de résultats standards. Il reste à imaginer d’autres séances à ajouter aux séances qui précèdent pour dévoiler les limites (et les bonheurs) de ces types de requêtes.
Un prolongement intéressant consisterait à présenter d’autres moteurs qui exploitent d’autres critères de sélection ou de présentation : Exalead et sa catégorisation a posteriori, Kvisu et la visualisation graphique des résultats (moins hiérarchique que la liste), le moteur du logiciel documentaire et l’indexation sur descripteurs (langage naturel versus langage documentaire), etc.
Vos commentaires
# Le 19 juin 2008 à 08:43, par richard peirano En réponse à : Une année avec Google (suite)
excellent, je prends.
Juste une pichenette de critique sur le eyetracking que je n’ai par ailleurs pas creusé non plus. Il semblerait que le triangle d’or ne soit plus vrai, notamment avec l’ajout sur la page de résultat de vignette. http://webilus.com/screenshot/le-triangle-dor-de-google-evolue
Bon je vole la séquence pour l’année prochaine, ça m’évitera d’avoir à refaire le monde.
Sur vos conseils, j’ai aussi travaillé sur google pour une formation aux enseignants qui recoupe votre travail.
J’ai une bibliographie et l’explication du dispositif. Il me reste à publier l’animation et le contenu de la séquence
# Le 21 juin 2008 à 10:20, par Frédéric Rabat En réponse à : Une année avec Google (suite)
Merci pour le commentaire et le vol de la séquence.
Pour la question du triangle d’or : je suis d’accord sur la question de son évolution, ce qui rend caduque l’étude de la société Enquiro (en 2005 je crois). Cependant je conserverai encore un peu cette page colorée parce que je constate qu’elle correspond aux habitudes de nombreux élèves et illustre l’empressement contre lequel je m’oppose.
# Le 29 juin 2008 à 14:56, par jérôme SACARD En réponse à : Une année avec Google (suite)
Bravo pour votre article très intéressant...
Quelques remarques d’utilisation dans le cadre scolaire :
Chez nous, la recherche se fait avec firefox et customize google.
“CustomizeGoogle est une extension pour Firefox qui permet améliorer les résultats de recherche de Google en ajoutant des informations supplémentaires (comme des liens vers Yahoo, MSN, Voila...) et en supprimant les informations non-demandées (comme les pubs et le spam). Toutes les fonctions sont désactivables.”
Cela ne change pas l’ordre des résultats, mais supprime les pubs et propose l’utilisation d’autres moteurs de recherche.
# Le 13 janvier 2010 à 16:35, par Eon Catherine En réponse à : Une année avec Google (suite)
Tout cela me semble excellent et j’ai bien l’intention de creuser...et même de voler moi aussi...
Cependant j’admire votre niveau de compétences, par exemple je ne comprend rien à votre premier paragraphe : eyetracking, ..
je suis très intéressée par votre séquence à l’intention des professeurs : comment avez-vous fait ?
Merci
# Le 24 novembre 2010 à 19:10, par Bénédicte Herrgott En réponse à : Une année avec Google (suite)
Bonjour Frédéric, je me replonge dans cette séquence après être "tombée" sur la fiche didactique de données sur Google élaborée par P. Duplessis.
(http://esmeree.fr/lestroiscouronnes/idoc/outils/fiche-de-donnees-didactiques-sur-google)
Nous avons eu la chance de le recevoir par deux fois en Corse et I. Ballarini est venu également animer un stage, l’année dernière à Bastia.
J’espérais que vous feriez un film de ta deuxième séance, mais la deuxième vidéo est la même que la première.
Nous attendons la suite avec impatience !
Amitiés
BH
Répondre à cet article
Suivre les commentaires :
|
