Bienvenue sur le blog des membres de la commission Annuaire de sites Prisme

Il comporte les principaux outils de recherche et d'analyse que des documentalistes de Prisme utilisent pour réaliser cet annuaire : nous les mettons à votre disposition.
Nos règles de traitement des sites et de fonctionnement en commission sont rassemblées sur ce blog. Chaque membre de la commission peut l'enrichir en proposant de nouveaux sites et autres informations utiles : il leur suffit de rédiger un nouveau message.

mardi 19 août 2008

Site Europe pour Muriel

J'ai trouvé le site Commission européenne intéressant, notamment sur les politiques européennes, avec des rapports sur l'inclusion sociale et autres doc de la commission Emploi et droits sociaux. C'est une partie de Europa, mais il est tellement dense... Muriel, je te passe la main : à toi de voir s'il faut en faire une fiche spécifique.
Pascale

vendredi 1 août 2008

Des sites appartenant à plusieurs domaines

Des organismes comme les ministères, l'INSEE... ont un site général avec des parties entières très intéressantes qui méritent d'être signalées et qui parfois appartiennent à des domaines différents.

ex : Ministère du travail, des relations sociales, de la famille et de la solidarité
Chaque onglet représente un domaine différent de l'annuaire Prisme sans compter les sous-thèmes ne figurant pas en page d'accueil comme l'ONPES.

Chaque titre de notice doit permettre d'identifier la particularité du site :
- ESPACE FAMILLE - MINISTERE DU TRAVAIL, DES RELATIONS SOCIALES, DE LA FAMILLE ET DE LA SOLIDARITE
- ESPACE PERSONNES AGEES - MINISTERE DU TRAVAIL, DES RELATIONS SOCIALES, DE LA FAMILLE ET DE LA SOLIDARITE

Méthodologie de suivi des sites :

Afin d'assurer la mise à jour de l'annuaire, les membres de la commission vérifient une fois par an tous les sites sélectionnés. Méthode :
  • Dans l'annuaire de sites Prisme, vérifier l'adresse url des sites des domaines à suivre.
  • Imprimer la fiche existant dans l'annuaire Prisme de chaque site à vérifier.
  • Vérifier tous les champs de cette fiche, comparer les pages d'accueil et le plan du site depuis la dernière vérification : compléter, corriger contenu et forme sur la grille d'analyse.
  • Utiliser Exalead en cherchant avec site: et after:JJ/MM/AAAA si le contenu des sites a été modifié depuis la dernière vérification. Ne pas hésiter à éliminer les sites qui n’ont pas été mis à jour depuis longtemps et semblent périmés, lors des mises à jour annuelles : chercher la date de la dernière mise à jour du site.
  • Faire les modifications en respectant scrupuleusement les consignes de saisies et de contenu des cellules
  • Noter la date de vérification des données dans DS
  • Changer le nom du producteur dans NOM si des modifications importantes du contenu ont été faites
Si aucune modification n'est faite par rapport à la fiche Prisme existante, ne pas renvoyer la notice à C. Samat.

Grille d'analyse d'un site web

Proposition de grille d'analyse à remplir en découvrant ou en vérifiant le site

A chacun de la modifier selon ses besoins.

DOMAINE (index correspondant à "sites par domaines" de l'Annuaire Prisme) ex. : SOLIDARITE/ECONOMIE/SOCIALE/AIDE HUMANITAIRE

DS (tous les sites sont vérifiés. Donc même si aucune modification n'est faite dans la fiche, cette date doit être systématiquement mise à jour) ex. : 2008.10.15

OP (index) ex. : AFMR-ETCHARRY

NOM (Sigle sans point puis développé entre parenthèses) attention : pas de virgule

SITE (adresse : saisir impérativement le http://)

MEL (le rechercher si possible. Peut être utile…) Si vide, mettre un point

DE (N’utiliser que les descripteurs du thésaurus Prisme 2005 séparés d'une virgule suivie d'un espace)

COMMENT (Noter le maximum pour élaguer ensuite. Saisie en minuscule) Indiquer le statut du site. Eviter les redondances avec les champs DE, DOC et LI. Style télégraphique permis. Pas de retour chariot.

DOC (index figurant dans les "Conseils pour l'analyse et le suivi des sites". Ne pas ajouter d’autres termes que ceux de l’index. Les noter pour suggestions d’évolution à la commission) Si vide, mettre un point

LI Revues - BDD bibliographiques Pas de retour chariot. Des points entre chaque information suivis d'un espace. Si vide, mettre un point

Grille word à imprimer

Bordereau Prisme de saisie des sites web :

Cliquez ici

Conseils pour l’analyse et l’indexation des sites

Avant de procéder à l’analyse d’un site : vérifier s’il n’est pas déjà dans l’annuaire de Prisme

Précisions globales :

  • Saisie en majuscule sauf l’adresse du site, le mail et le champ Commentaire.

Attention, un espace après chaque point.

  • Eviter la redondance entre les différents champs

Ne pas indiquer dans le champ Commentaire les informations qui sont mentionnées dans la zone Informations Documentaires.

Ex : Formations - Stages …

Éliminer l’évènementiel (ex : le nom d’un rapport) car trop "périmable" et impossible à réactualiser régulièrement.

Précisions sur la saisie des différents champs.
Se reporter également au “ bordereau de saisie ” qui indique les règles de base.

  • DO : un seul domaine, champ mono article

  • DS : changer la date à chaque fois que la fiche du site est vérifiée même si aucune modification n'est nécessaire. Saisie année.mois.jour : ex. 2006.03.20

  • OP : nom du producteur saisi selon la règle du bordereau

  • NOM : les sigles sont saisis sans point. Leur développement est indiqué entre parenthèses.

  • ADRESSE: saisir le http://

  • MEL : adresse mail si possible

  • DES : limiter le nombre de descripteurs très généraux et rechercher plutôt les descripteurs représentatifs de la spécificité du site. Ceux-ci doivent appartenir au thésaurus Prisme.

  • COMMENT : La décision de la Commission sur ce champ a été de l’alléger au maximum de toute information évidente (Présentation de l’organisme, Missions etc) et de cibler l’information qualitative qui révèle l’intérêt informatif du site. En revanche, préciser s'il s'agit d'un portail ou d'un blog.

La saisie s’effectue en minuscule sans retour chariot.

    • éléments à mentionner :

- le statut de l’organisme producteur (en début de commentaire). Pour permettre des réponses pertinentes lors de l’interrogation, saisir les termes sous cette forme :

Statut public, statut associatif, site personnel (Dans le doute, s’abstenir de le mentionner.)

- les éléments particuliers qui font l’intérêt du site,

- les informations documentaires qui méritent d’être mises en valeur,

Ex : MILDT : site créé par… détailler l’ensemble des partenaires.

    • éléments à ne pas indiquer

- les appréciations sur la facilité d’utilisation, la présentation, l’organisation...

Ex: site agréable, mis à jour régulièrement…(La mise à jour est en soi un critère de sélection du site.)

- le plan du site implicite, etc

  • DOC : Utiliser la liste suivante (elle peut être évolutive) :

Adresses = organismes / répertoires

Article en ligne = s’ils sont signés ou si la source est mentionnée

Base de données = implicitement les bases de données bibliographiques en accès gratuit. En champ LI, indiquer leur nom. Spécifier si l'accès est payant ou s’il s’agit de bases de données autre que blibliographiques.

Blog = blog ou liste de blogs signalés et pointant sur le site

Colloques = journées d'études, conférences, manifestations

Contacts = personnes ressources / personnes relais

Document audio en ligne = interview enregistrés, doc à podcaster, doc pour MP3...

Dossiers documentaires

Expériences de terrain

FAQ

Fiches de lecture

Fiches techniques

Flux RSS

Formations

Forum (y compris Liste de discussion)

Lettre électronique (pour lettre de diffusion)

Lexique

Liste de diffusion

Offres d’emploi

Organigramme

Portail

Publications = catalogue de publication, présentation avec sommaire

Rapport en ligne = en texte intégral

Résumés = résumés de publications, vidéos...

Revue de presse

Revue en ligne = uniquement si texte intégral et accès gratuit

Sigles

Stages

Textes officiels = en texte intégral

Tutoriel

Veille sur des sites : à mentionner uniquement s'il s'agit d'un analyse des sites. Ne pas utiliser cet intitulé pour des sites en lien ou la simple présentation d'une liste

Vidéo en ligne

Vidéothèque

La présence de bibliographies est mentionnée en zone descripteurs.

Cette rubrique est importante car indexée : elle permet des recherches plus affinées.

Attention !! Ce champ s’intitule DOC dans la grille d’analyse et INFORMATIONS DOCUMENTAIRES sur le site Prisme.

  • LI : Saisie libre en majuscule. Respecter si possible l’ordre proposé :

- REVUES : indiquer le titre du périodique. Implicitement, les articles sont en ligne, sinon, mentionner (sommaire, articles)

Mettre REVUE devant le titre sauf si le titre est connu ou l’intitulé explicite (ex Lettre d’information, Bulletin …)

- Base de données : indiquer le nom et les spécifications (payant...). Rappel : implicitement bdd bibliographiques gratuites.

Ex. : Place publique : base de données d’initiatives.

Règle de saisie dans ce champ : un point après chacune des rubriques mentionnées

UN ESPACE APRES LE POINT (ou la virgule)

AUCUN RETOUR CHARIOT

Procédure de mise à jour de l’annuaire site Prisme

Sous Word :
  • ouvrir le fichier txt reçu de prisme par mail
  • faire apparaître les marques de formats : Outils / Options : marques de formats. Cocher : tous
  • vérifier les séparateurs utilisés :
    • tabulation = ;;
    • marque de paragraphe = +++
  • remplacer ;; par tabulation et +++ par marque de paragraphe : Edition / remplacer : plus / spécial
  • corriger ce qui est souligné en rouge ou en vert si besoin : fautes d'orthographe, espaces à mettre ou enlever, accents...
  • enregistrer toujours en txt brut et fermer.
Sous Excel :
  • ouvrir et enregistrer ce nouveau fichier en format excel :
    • sur la colonne DO, grâce à un tri, sélectionner les fiches de nos domaines à corriger et supprimer les autres lignes.
    • ajouter les lignes de nouveaux sites repérés
    • faire les corrections suivant le guide et le bordereau de Prisme. Mettre un point dans les cellules vides.
    • mettre à jour le champ DS de tous les sites même non corrigés
  • vider la colonne REF
  • vérifier sur tout le fichier que les séparateurs pour l'export Prisme (;; ou +++) ne sont pas utilisés : Edition / rechercher
  • vérifier qu'aucun retour à la ligne n'a été fait à l'intérieur d'une cellule excel.
  • enregistrer à nouveau ce fichier en txt en le renommant
Sous Word :
  • ouvrir ce dernier fichier txt créé
  • faire à nouveau apparaître les marques de formats : Outils / Options : marques de formats. Cocher : tous
  • remplacer tabulation par ;; et marque de paragraphe par +++ : Edition / remplacer : plus / spécial
  • vérifier pour un dernier contrôle ce que le correcteur d'orthographe souligne en rouge ou vert et corriger éventuellement les dernières coquilles
  • enregistrer toujours en txt brut. Attention : ne pas exporter un fichier en lecture seule.

Envoyer toutes les notices de chacun de nos domaines de veille par mail à Catherine Samat : c.samat@ifrass.fr

Bordereau de saisie d'un site pour Prisme

DO

Domaine

  • Champ obligatoire.
  • Un seul domaine par site. (A l’étude : 2 domaines possibles)
  • Remplir en utilisant les termes proposés

DS

date de saisie

  • Champ obligatoire.
  • A remplir pour le première saisie et puis à mettre à jour à chaque fois que la fiche du site est vérifiée même si aucune modification n'est faite
  • Format automatique (année.mois.jour) ex : 2006.03.20

OP

organisme producteur

  • Champ obligatoire.
  • Identification du producteur. A remplir en majuscules : SIGLE-VILLE : ex IFRASS-TOULOUSE

NOM

Nom du site

  • Champ obligatoire. MAJU
  • Sigles sans point.
  • Pour le nom, prendre systématiquement la forme siglée et indiquer entre parenthèses son développé. Ex : ASH ( ACTUALITES SOCIALES HEBDOMADAIRES) Ainsi la recherche avec troncature permettra de trouver aussi bien à partir du nom que du sigle.
  • Lorsque le site n'a pas de nom, choisir le terme le plus explicite pour rendre compte du contenu informatif

SITE

Adresse du site

  • Champ obligatoire. MINU
  • Saisir l'adresse complète, y compris le http://

MEL

Contact

  • Si possible

DE

Mots-clés

  • Champ obligatoire
  • Saisir des descripteurs Prisme. Utiliser le thésaurus

  • Espace permis après le séparateur (virgule).
  • Les CD peuvent être proposés (ils sont dans ce cas signalés au moment de l’envoi de la notice)

COMMENT

Commentaire

  • Saisie en minuscules, première lettre en majuscule, espace après le point. Les accents passent. Pas de retour chariot.
  • Les rubriques proposées sont indicatives et non obligatoires :

    • Statut de l’organisme producteur (statut associatif, public, site personnel)
    • Descriptif du contenu, ciblé sur les informations documentaires
    • Eléments d'appréciation documentaires…

DOC

Informations

documentaires

  • Saisie avec la liste
  • Liste évolutive

LI

Informations
en ligne

  • Pas de retour chariot - MAJU.
    • Périodiques : ne citer que ceux qui intéressent notre secteur. Indiquer entre parenthèse si seul le sommaire est accessible. Mettre Revue devant le titre sauf si l’intitulé est explicite (ex : Lettre d’information, Bulletin …)
    • Rapports, textes officiels, articles...
    • BDD : citer le nom des BDD bibliographiques. Les autres se mettent dans le champ COMMENT. Indiquer entre parenthèse si l’accès est payant.

Mail accompagnant l'export

Dans le mail accompagnant l'envoi du fichier des sites modifiés ou ajoutés, merci de signaler :
- les sites supprimés,
- les sites nouveaux,
- sites à mettre à jour
afin que chacun puisse mettre sa base à jour.

Rappel : pour ne pas avoir à dédoublonner, renvoyer tous les sites du domaine mis à jour.

Stratégie d'interrogation

Les questions importantes avant de commencer une recherche sur internet :
  • Qui détient l'information que je cherche ?
  • Quels sont les mots qui ont toutes les chances d'apparaître dans le document que je cherche ?
  • Dans quel ordre apparaissent-ils dans le document recherché ?

Exemple de fichier de mise à jour :

L'Annuaire des sites Prisme à mettre à jour arrive sous cette forme dans les boites mail des membres de la commission :

DO;;DS;;OP;;NOM;;SITE;;MEL;;DE;;COMMENT;;DOC;;LI+++HANDICAP;; 2006.02.10;;CESAP-FORMATION;;CTNERHI (CENTRE TECHNIQUE NATIONAL D'ETUDES ET DE RECHERCHES SUR LES HANDICAPS ET INADAPTATIONS) ;;http://www.ctnerhi.com.fr/;;ctnerhi@ctnerhi.com.fr et idehdoc@ctnerhi.com.fr;;HANDICAP,HANDICAPE,LEGISLATION,RECHERCHE;;Site associatif. Le CTNERHI rassemble, diffuse et tient à jour une documentation française et étrangère concernant les études et les diverses politiques en direction des personnes handicapées. Le site présente les études en cours et les axes de recherche du CTNERHI. Présentation des séminaires de formation. Présentation du centre de documentation et accès aux bases de données SAPHIR (15000 ouvrages et 200 collections de périodiques) et LEGI (textes réglementaires sur le handicap et le social depuis 1989). Accès au catalogue des publications. Site accessible aux personnes déficientes visuelles.;;PUBLICATIONS,RESUMES,COLLOQUES,FORMATIONS,LETTRE DE DIFFUSION;;HANDICAP (SOMMAIRE),FLASH-INFORMATION- HANDICAP. BDD SAPHIR ET LEGI. RAPPORTS (TEXTE OU RESUMES)+++IMMIGRATION;;2006.05.11;;IFRASS-TOULOUSE;;GISTI (GROUPE D'INFORMATION ET DE SOUTIEN DES IMMIGRES);;http://www.gisti.org;;gisti@gisti.org;;IMMIGRE,EXCLUSION SOCIALE, ETRANGER, DROIT,JURISPRUDENCE,HISTOIRE, REFUGIE, LEGISLATION;;Site associatif très centré sur l'aide juridique. A la une (l'actualité de l'immigration). Autoportrait. Adresses : organisation et sites. Coordonnées thématiques et alphabétiques des associations et syndicats du secteur. Idées : débats et actions : pétitions. Pratique : se servir du droit. Le droit : infos pour les juristes. Communiqués. Articles. Courriers-type. ;;FORUM,REVUE DE PRESSE,PUBLICATIONS,ADRESSES,RESUMES,COLLOQUES,FORMATIONS,FAQ,VEILLE SUR DES SITES;;PLEIN DROIT (SOMMAIRE ET SELECTION DE TEXTES), CAHIERS JURIDIQUES (SOMMAIRE) NOTES PRATIQUES ET NOTES JURIDIQUES (SOMMAIRES). GUIDES JURIDIQUES (SOMMAIRES ET RESUMES). TEXTES OFFICIELS.+++

En exemple, il s'agit ici de la description de 2 sites de l'annuaire de sites Prisme.

Après traitement (corrections, ajouts ou retraits de sites), la mise à jour du fichier doit être renvoyée sous cette forme à C. Samat, d'où la procédure de mise à jour.

Vérification de la crédibilité d'un site

- trouver et vérifier le responsable d'un site grâce à :
  • Domain dossier : taper l'adresse du site à vérifier et chercher l'organisme et/ou la personne responsable. Utile parfois pour trouver l'adresse ou le téléphone d'un site perso à contacter.
  • Afnic Whois pour les sites français : taper l'adresse sans les www., soit le nom de domaine et l'extension. Bonne présentation de la réponse.
- rechercher qui cite ce site :

dans google, la fonction link: permet de trouver qui et combien de sites pointent vers une page ou un dossier du site à vérifier.
ex. :
link:jt.france3.fr pour chercher tous les liens pointant vers le site complet
link:www.insee.fr/fr/regions/ pour chercher tous les liens pointant vers des pages dont l'url commence par www.insee.fr/fr/regions/, c'est-à-dire pointant vers une partie du site seulement.

Fonctions avancées des moteurs de recherche

Syntaxe de recherche commune à Google, Yahoo, Live et Exalead :
  • ET : espace
  • OU : espace OR espace
  • SAUF : - (ex. : -france)
  • contient l'expression : " " (ex. : "travail social")
  • obligation de tenir compte de tous les caractères (accent, pluriel...) : + (ex. : +marchés)
  • pas de différence entre les mots écrits en minuscules et en majuscules
  • limiter sa recherche à un nom de domaine ou une extension particulière : site: (ex. : site:gouv.fr ou site:sante.gouv.fr
Syntaxe intéressante propre à Google :
  • trouver les pages qui pointent vers un site : link: (ex. : link:documentation-sociale.org)
  • trouver une extension particulière (pdf pour des rapports par exemple ou des pps pour des diaporamas) : filetype: (ex. : rapport service personne filetype:pdf)
  • trouver une chaine de caractères dans une url : inurl: (ex. : inurl:documentation-sociale)
  • chercher une définition : define: (ex. : define:resilience)
  • dans les réponses, en cache permet de trouver le mot recherché dans la page du site et la date de la dernière fois que Google l'a trouvée.
Syntaxe intéressante propre à Exalead :
  • troncature possible : * (ex. : maltrait*)
  • syntaxe booléenne traditionnelle acceptée même si elle n'est pas indispensable : AND OR NOT (ex. : pedophilie OR "abus sexuel" AND justice NOT outreau)
  • recherche sur un pays en particulier : country: (ex. : "revenu minimum" country:ch)
  • recherche sur des contenus récents : after:JJ/MM/AAAA (ex. : after:"revenu minimum" after:01/01/2007)
  • recherche sur des contenus anciens : before:JJ/MM/AAAA (ex. : loi egalite chances before:15/03/2006)
  • avec les réponses, sont proposés des mots associés qui permettent d'affiner la recherche

Critères de classement des réponses d'un moteur de recherche

Principaux critères sachant qu'au total, un bon moteur de recherche en compte une soixantaine :
  • critère 1 : plus un mot recherché apparaît dans un site, plus le site sera classé dans les premières réponses. Et plus il apparaît précocement, plus le site a des chances de figurer en première page :
  • critère 2 : présence dans l'en-tête,
  • critère 3 : présence dans l'adresse du site,
  • critère 4 : présence dans le titre du site,
  • critère 5 : présence dans le lien hypertexte,
  • critère 6 : nombre de liens pointant sur le site indiquant que le site est beaucoup cité, par des sites eux-mêmes beaucoup cités.
attention : le critère "présence des mots dans les métadonnées" n'est plus pris en compte dans Google depuis 2009.

Outils de veille automatique pour suivre des domaines

En plus de la recherche à partir des annuaires ou des moteurs de recherche, on peut tenter divers moyens de cibler des domaines particuliers et d'automatiser la veille. Cela suppose une formulation précise de la demande pas toujours facile. Le bruit sera néanmoins important car les réponses vont correspondre à quelques nouveaux sites, mais surtout à de nombreuses nouvelles pages de sites.

  • des outils de veille automatisée, type Copernic Agent Professional, permettent de créer des requêtes pré-enregistrées pour assurer une veille sur un domaine. Une version gratuite intéressante est téléchargeable.
Le choix des opérateurs est limité à :
- un des mots = OU
- tous les mots = ET
- expression exacte

  • des alertes Google permettent de recevoir par mail les nouveautés sur le domaine recherché.
Dans Google, on peut rechercher un mot ou une expression sur le titre des pages web ou dans l'url pour limiter le nombre de réponses.

ex : allintitle:formation à distante OR intitle:foad OR allintitle:formation ouverte OR inurl:foad


Outils de veille automatique sur les sites sélectionnés

  • des alertes Google permettent de recevoir systématiquement par mail les changements sur certains sites sélectionnés. Attention : éviter de mettre une alerte sur des sites très souvent mis à jour.
ex : site:rosenczveig.com

  • les fils RSS : si les sites à suivre ont des fils RSS permettant de suivre leur actualisation, il suffit de les rassembler dans Netvides domaine par domaine pour les suivre.