HTTrack
The Web Mirror Utility

English version

 

 

Overview La version 1.16 est disponible (Septembre 1998)

WinHTTrack

HTTrack est un aspirateur web. Il vous permet de transférer un site web d'Internet vers votre disque dur, en construisant récursivement toute la structure, récupérant html, images et fichiers du serveur vers votre ordinateur. Les liens sont reconstruits de manière relative, de façon à pouvoir browser librement le site local via votre butineur habituel. Vous pouvez transférer (miroir) plusieurs sites ensembles de façon à pouvoir passer de l'un à l'autre librement. Vous pouvez également mettre à jour
(update) un site existant, ou continuer un transfert interrompu. Le robot est entièrement configurable, avec une aide intégrée.
WinHTTrack est la version Windows9x de HTTrack. Elle est disponible dans l'archive ZIP de HTTrack.


VERSIONS SUN SOLARIS ET IBM AIX SEULEMENT:
Sur Sun Solaris et AIX, HTTrack est composé de deux programmes: le shell graphique, et le robot.
Le Shell vous permet de controller facilement le robot, via une interface graphique ; il est disponible à la page Shell HTTrack.
Vous trouverez ici seulement le robot, qui peut être utilisé comme un programme en ligne de commande.


 

Features de HTTrack

 

Download version 1.16 (26/09/98)

Si vous aimez ce programme, ou si vous avez une question, n'hésitez pas à nous contacter!
La documentation est maintenant disponible pour WinHTTrack et HTTrack et contient également les FAQ.
Vous avez pris note que ce programme n'est en aucun cas garanti, et est livré "tel que". Ceci est la version 1.x de HTTrack.
Vous pouvez trouver HTTrack sur beaucoup de ftps à travers le monde (nom: httrkXXX.zip, XXX=numéro de version)
(exemple: miroirs simtel.net)

Plateforme

Cliquez sur le fichier correspondant pour télécharger

Version actuelle

Windows95/98

httrack.zip

1.16

SUN Solaris (5.6)

httrack.tar.gz

1.16

IBM AIX (4.0)

httrack.tar.gz

1.16

Linux PC

httrack.tar.gz

1.16



 

Usage de HTTrack

La documentation est maintenant disponible pour WinHTTrack et HTTrack et contient également les FAQ.

 

Sur SUN/Solaris et IBM/AIX, le plus simple est d'utiliser le shell graphique, mais vous pouvez également passer par une simple ligne de commande.
Tapez httrack (sans aucun paramètres) pour lister la liste des options. Paramètres et adresses ne doivent pas nécessairement être placés dans un ordre donné.
Il y a également des commandes speciales, comme l'option Nx.

Exemple:

httrack www.myweb.abc/mydir/index.hml
httrack www.myweb.abc/mydir/index.hml  www.otherweb.abc/~friend/cool/
httrack www.myweb.abc/mydir/index.html www.otherweb.abc/~friend/cool/ -N1 -P proxy.myweb.abc:1234
httrack www.myweb.abc/mydir/index.html +www.otherweb* +www.hisweb*.net* -*.com*

Le premier exemple transférera le site partant de 'www.myweb.abc/mydir/index.hml' (et pas tout www.myweb.abc, évidemment, bien que ce soit possible!)
Le second effectuera le miroir de 'www.myweb.abc/mydir/index.hml' et de 'www.otherweb.abc/~friend/cool/" ensembles. (le troisième séparera html et images en 2 répertoires (option N1), et utilisera un proxy (option P))
Le quatrième exemple montre l'utilisation de jokers (*) pour accepter ou refuser des types d'adresses spécifiques. Si aucun '*' n'est utilisé après le '+' ou le '-' (si vous spécifiez donc une adresse complète), l'adresse en question sera acceptée/refusée lorsqu'elle sera rencontrée.

Les options par défaut sont fixées de façon à ce que vous n'ayez que très peu d'options à indiquer.



 

MouseWare! Encouragez-nous!

Ce programme est GRATUIT, mais si vous l'aimez, encouragez nous: envoyez une souris! (type PC, port type PS2), ou la somme nécessaire pour en acheter une.
(exemple: FF50, $10, £5 - même 10FF peuvent nous aider!)
C'est un peu inhabituel pour un shareware, mais nous avons vraiment besoin de souris pour travailler...
Si vous réalisez un miroir en ligne sur le web grâce à HTTrack, envoyez nous également un mail svp.

Envoyez vos souris (ou vos dons) à:

Xavier Roche & Yann Philippot / HTTrack

ISMRA - ENSI of CAEN
6, boulevard du Marechal Juin
14050 CAEN Cedex
FRANCE

Email: roche@ensicaen.ismra.fr
philippo@ensicaen.ismra.fr



 

Comments : ENVOYEZ-NOUS UN MESSAGE!

Nous espérons que vous apprécierez cet utilitaire et que vous prendrez autant de plaisir à l'utiliser que nous en avons eu à le développer. Si vous l'aimez, encouragez nous en envoyant vos commentaires et vos remarques. Les problèmes et les reports de bugs sont également les bienvenus, pour le shell et pour le robot.

 


 

Updates et correction de bugs

A faire:
- Robot: Gestion des classes Java
- Interface: Fichiers d'aide

1.16
+ Nouveau : Classes Java et sous classes prises en compte!
+ Nouveau: Meilleure analyse JavaScripts
+ Nouveau: Option: Abandon des sites en cas e timeout/transfer trop lent
+ Shell: Interface améliorée

1.15b
+ Corrigé: Quelques bugs corrigés
1.15:
+ Shell: Interface améliorée
+ Nouveau: Robot amélioré (certyains fichiers via javascript sont désormais détectés!)
+ Nouveau: Jokers améliorés (par exemple, +www.*.com/*.zip)
+ Nouveau: fichier 'config' pour configurer proxy, chemins.. une seule fois

1.11
+ Nouveau: Démarrage à heure spécifique
+ Nouveau: Option temps de transfert maximum
+ Shell: Interface améliorée pour une utilisation simplifiée
+ et plus bientôt..

1.10e
+ Corrigé: Les maps n'étaient pas correctement gérées (bug stupide)
1.10d:
+ Corrigé: Fichier index.html bogué
1.10c
+ Shell: Champ "time out" nécessitait le champ "transfer rate"
1.10b
+ Corrigé: Meilleure gestion mémoire
1.10
+ Nouveau: Option "Taux transfert minimum" ajouté (éviter les sites les plus lents)
+ Nouveau: Les sites "morts" ne gèlent plus HTTrack
+ Corrigé: Encore des problèmes avec les tags code/codebase
+ Nouveau: Détection des ruptures de liens améliorée

1.04
+ Corrigé : Certains liens n'étaient pas correctement lus (pages avec des tags "codebase")
+ Shell: Interface améliorée

1.03 (Pas de changements pour la version en ligne de commande)
+ Shell:Gros bug corrigé (taux de transfert TRES lents)

1.02
+ Corrigé: Certains fichiers java n'étaient pas correctement transférés
+ Nouveau: La vitesse a été améliorée
+ Corrigé: Fichiers log plus précis
+ Shell: L'interface a été améliorée

1.01
+ Corrigé: Erreurs lors de la construction de la structure des fichiers

1.00 - The 1.00, Yeah!
+ Nouveau: base et codebase sont maintenant scannés

0.998 beta-2
+ Corrigé: Bug des fichiers multiples (fichiers ayant le même nom dans un répertoire identique) avec l'option -O corrigé

0.997 beta-2
+ Corrigé: Les noms de fichiers avec des '%' n'étaient pas correctement renommés
+ Corrigé: bug deétecté dans la 0.996: certains fichiers ne sont pas écrits sur disque!!

0.996 beta-2
+ Nouveau: Option -O (chemin pour muroir/fichiers log)
+ Nouveau: L' heure/date des fichiers inchangés reste inchangée durant une update

0.99 beta-2
+ Nouveau: Champ "User-agent"
+ Nouveau: Raccourcis (--spider etc.)
+ Nouveau: Les liens non téléchargés sont reconstruits de manière absolue
+ Nouveau: L'option 'g' (juste get files in current directory) a été ajoutée
+ Nouveau: Analyse des liens primaires a été améliorée
+ Fixed: bug du "304" corrigé

0.25 beta-2
+ Corrigé: Plantages durant certains miroirs corrigé!
+ Nouveau: Plus d'options 'N' (filenames type)

0.24 beta-2
+ Corrigé: Restart/Update avec un cache ne fonctionnait pas (pas du tout..)
+ Corrigé: Les jokers fonctionnent correctement (càd. +www.abc.com* fonctionne)
+ Nouveau: L'option 'n' (get non-html files near a link) a été ajoutée!

0.23 beta-2
+ Corrigé: L'option 'M' (site size) ne fonctionnait pas
+ Corrigé: Les fichiers dépassant 65Ko n'étaient pas correctement écrits

 


 

Credits

Shell graphique développé par Yann Philippot
Robot développé par Xavier Roche
Project digiré by Patrick Ducrot et Daniel Carré

HTTrack a été développé en C et C++, en approximativement  10,000 lignes de code source. Nous avons dépensé de très, très nombreuses heures à tester et à débugger ce programme, de telle façon à ce qu'il soir le plus performant possible. Nous pensons que nous avons fait du bon boulot ;-)

Projet développé à l'ENSI Caen - ISMRa

©1998 Xavier Roche & Yann Philippot, tous droits réservés.

HTTrack

wmu.gif (2416 bytes)