On 2006-10-27 14:33:27 +0200, Stephane Jourdois wrote:
Du coup pourquoi ne pas donner direct le script perl qui va bien, et qui en profitera pour comparer les binaires réellement pour éviter les collisions ?
Celui-là ne va pas, parce-qu'il bufferise le résultat entier de la commande précédente, ce qu'a déjà fait le sort mais qu'on ne pouvait pas éviter. on double la conso mémoire de la solution complête, et on impacte dramatiquement les perfs.
Pour chercher des fichiers identiques dans un répertoire, mieux vaut lire les fichiers bloc par bloc et comparer les blocs directement, car un hash est long à calculer et les fichiers diffèrent en général dans les premiers octets. Mais tout d'abord, faire une comparaison des longueurs, puisque l'accès à cette donnée est plus rapide que d'ouvrir le fichier. -- Vincent Lefèvre <vincent@vinc17.org> - Web: <http://www.vinc17.org/> 100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/> Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)