Capturer un site
TIC et HG



A. Questions préliminaires.

1. L'intérêt de la capture.

La capture s'avère rapidement quelque chose d'essentiel lorsque l'on veut faire un véritable travail sur un site quelconque.
En effet :

Cela est moins indispensable dans le cas d'un établissement relié à internet par le câble, rendant l'accès aux site rapide et le coût forfaitaire.

Cela est totalement ridicule si vous faites un travail sur la recherche documentaire sur internet à travers les moteurs de recherche...


2. Les contre-indications.

Il y a tout de même quelques inconvénients :


3. Et le droit dans tout ça !!!

Enfin, se pose le problème du droit :
Il en va des sites web comme des K7 vidéo : ils sont protégés par la propriété intellectuelle et vous ne pouvez pas les utiliser devant une assemblée sans l'autorisation de l'auteur. Sauf...

... à utiliser des extraits.

Si sur une cassette vidéo, cette notion a été définie : (10% du film à concurrence de 3 mn maxi), il n'en va pas de même pour les sites web : allez définir un pourcentage : en volume de données ? en nombre de pages ? Connaissez-vous le volume de données et le nombre de pages des sites que vous rapatriez ? Connaissez-vous d'ailleurs, le nombre de pages ou de données des sites que vous réalisez (Pas moi)? Qu'est-ce qu'un site internet ?



B. Rapatrier.

1. Les logiciels.

Il existe plusieurs types de logiciels de capture de site.


2. Préparation du disque et du logiciel.

Toujours par mesure de clarté, il est conseillé de créer un répertoire spécifique pour les captures. Je vous propose :

c:/www/captures/
Memoweb créera automatiquement un nouveau sous-répertoire pour chaque site.
  1. Lancer Memoweb.
  2. Barre de menus - Préférences - configuration.
  3. Onglet Communication : Nombre de Sockets, laisser 5 si vous êtes en RTC ou en RNIS, vous pouvez monter beaucoup plus sur le câble... Sauf que, le site risque de prendre cela pour une attaque en règle et vous fermer la porte au nez. Laissez donc 5...
  4. Onglet Répertoire (en bas) : Indiquer dans le champ actif le répertoire que vous venez de créer, soit en le tapant, soit en utilisant le bouton Parcourir.
  5. Onglet Navigateur : Cliquez sur Recherche automatique de navigateur, si cette case n'est pas active. Si vous allez utiliser le site sur la même machine, cliquez sur ajout automatique d'un signet, sans quoi, c'est inutile.
  6. Onglet pages Html : laissez tel quel.


3. Lancer une capture.

Le plus simple, est de la lancer lorsque vous êtes déjà sur votre navigateur, en connexion, à la page de départ du site que vous souhaitez capturer. Sans quoi, il faudra avoir relevé l'adresse.

  1. Lancer Memoweb.
  2. Cliquer sur Nouveau.
  3. Une fenêtre s'ouvre avec tous les champs déjà complétés. Modifier éventuellement le répertoire de capture et le nom.
  4. Cliquez sur le bouton Créer et Capturer, une autre fenêtre s'ouvre montrant la capture des pages.
  5. Pendant cette capture, vous pouvez faire autre chose (mais évitez la navigation internautique débridée ...).
Lorsque toutes les pages sont capturées, Memoweb vous indique que tout est correct.



Votre site est capturé et prêt à être consommé sans modération en local. Mais pensez que tout le monde ne sait pas obligatoirement l'ouvrir... Pensez donc à faire une page html d'indexation de vos sites rapatriés, ou à faire un dossier spécifique dans vos signets....



Pascal Boyries, avril 1998