 |
Capturer un site |
TIC et HG |
A. Questions préliminaires.
1. L'intérêt de la capture.
La capture s'avère rapidement quelque chose d'essentiel lorsque l'on veut faire un véritable travail sur un site quelconque.
En effet :
- Le site est ensuite accessible en local en monoposte ou à travers le réseau de l'établissement.
- Les enseignants peuvent préparer des séquences de travail sur le site, sans consommer des heures de connexion.
- Cela permet l'accès au site sur une longue période en ne dépensant qu'une connexion pour le rapatriement.
- Cela évite que, lors de la séance de travail, les élèves ne se mettent à butiner pour leur compte.
- Cela évite l'encombrement d'internet par de multiples connexions pour aller au même endroit.
Cela est moins indispensable dans le cas d'un établissement relié à internet par le câble, rendant l'accès aux site rapide et le coût forfaitaire.
Cela est totalement ridicule si vous faites un travail sur la recherche documentaire sur internet à travers les moteurs de recherche...
2. Les contre-indications.
Il y a tout de même quelques inconvénients :
- Il n'y a pas de mise à jour automatique
- Les frames ne sortent pas toujours correctement.
- les documents accessibles par formulaires ne sont pas rapatriés.
- Le Java ne passe pas sur un site rapatrié : dommage pour ceux qui voulaient récupérer "6 milliards d'hommes...."
3. Et le droit dans tout ça !!!
Enfin, se pose le problème du droit :
Il en va des sites web comme des K7 vidéo : ils sont protégés
par la propriété intellectuelle et vous ne pouvez pas les utiliser devant une assemblée
sans l'autorisation de l'auteur. Sauf...
... à utiliser des extraits.
Si sur une cassette vidéo, cette notion a été définie : (10% du
film à concurrence de 3 mn maxi), il n'en va pas de même pour les sites web : allez
définir un pourcentage : en volume de données ? en nombre de pages ?
Connaissez-vous le volume de données et le nombre de pages des sites que vous
rapatriez ? Connaissez-vous d'ailleurs, le nombre de pages ou de données des sites que
vous réalisez (Pas moi)? Qu'est-ce qu'un site internet ?
B. Rapatrier.
1. Les logiciels.
Il existe plusieurs types de logiciels de capture de site.
- Certains indexent les pages qui se trouvent dans le cache de votre navigateur : il faut alors que vous soyez allé voir les pages concernées. Avantage : vous ne conservez que ce qui vous intéresse. Inconvénient, il faut charger toutes les pages qui vous intéressent. Exemple : Netcaster de Netscape.
- D'autres se connectent au site concerné et rapatrient toutes les pages du site. Avantage : il se débrouille tout seul. Inconvénient, vous avez tout, et parfois beaucoup d'inutile. Exemple : Memoweb qui est téléchargeable à http://www.memoweb.com et que concerne la suite de ce document. Mais il n'est pas le seul.
2. Préparation du disque et du logiciel.
Toujours par mesure de clarté, il est conseillé de créer un répertoire spécifique pour les captures. Je vous propose :
c:/www/captures/
Memoweb créera automatiquement un nouveau sous-répertoire pour chaque site.
- Lancer Memoweb.
- Barre de menus - Préférences - configuration.
- Onglet Communication : Nombre de Sockets, laisser 5 si vous êtes en RTC ou en RNIS, vous pouvez monter beaucoup plus sur le câble... Sauf que, le site risque de prendre cela pour une attaque en règle et vous fermer la porte au nez. Laissez donc 5...
- Onglet Répertoire (en bas) : Indiquer dans le champ actif le répertoire que vous venez de créer, soit en le tapant, soit en utilisant le bouton Parcourir.
- Onglet Navigateur : Cliquez sur Recherche automatique de navigateur, si cette case n'est pas active. Si vous allez utiliser le site sur la même machine, cliquez sur ajout automatique d'un signet, sans quoi, c'est inutile.
- Onglet pages Html : laissez tel quel.
3. Lancer une capture.
Le plus simple, est de la lancer lorsque vous êtes déjà sur votre navigateur, en connexion, à la page de départ du site que vous souhaitez capturer. Sans quoi, il faudra avoir relevé l'adresse.
- Lancer Memoweb.
- Cliquer sur Nouveau.
- Une fenêtre s'ouvre avec tous les champs déjà complétés. Modifier éventuellement le répertoire de capture et le nom.
- Cliquez sur le bouton Créer et Capturer, une autre fenêtre s'ouvre montrant la capture des pages.
- Pendant cette capture, vous pouvez faire autre chose (mais évitez la navigation internautique débridée ...).
Lorsque toutes les pages sont capturées, Memoweb vous indique que tout est correct.
Votre site est capturé et prêt à être consommé sans modération en local. Mais pensez que tout le monde ne sait pas obligatoirement l'ouvrir... Pensez donc à faire une page html d'indexation de vos sites rapatriés, ou à faire un dossier spécifique dans vos signets....
Pascal Boyries, avril 1998