20100909: Cette page décrit un "chantier en travaux", à venir les pages applicatives utilisables.
0) GAFFE: le fait de lire tous les fichiers les "débleuit" et donc augmente l'encombrement sur le disque! (et voir quand on prend l'attribut)
1) placer dans la racine un fichier avec les caractéristiques du disque (numéro de série, nom du volume, format, partitions, etc ...)
1bis) info nulle quand sauvegarde ou modification non documentée
2) placer dans chaque dossier un fichier avec le
nom de ce dossier, éventuellement son histoire, pour moi en général h.txt
2bis) serait mieux d'utiliser un type fichier avec un magic number connu de photorec (et si possible peu fréquent dans le dossier) (.doc par exemple) de manière à ne pas devoir le chercher dans le tas des .txt
2ter) voir si on peut ajouter un magic number à
PhotoRec ? réponse: OUI, mais faut recompiler!
3) associer à chaque fichier un fichier de même nom + ".label" contenant le dit nom)
3bis) comme 2 bis serait plus résistant si contenu avec un magic number reconnu
4) inventorier les fichiers qui se nomment eux même (narcissisme) peut-être possible en exif/jpeg en utilisant le champ "commentaire"?
5) si possible (par exemple dans le fichiers dont on est l'auteur) placer (tête ou queue) du fichier une ligne avec le nom & chemin de ce fichier
5bis) compresser le fichier (par windows=pkzip ou gzip) de manière à ce qu'il contienne son nom
6) placer dans le fichier jpeg, (enfin, dans son en-tête
exif) (et autre fichier intégrant une documentation) un tag avec le nom du fichier; il y a UNE entrée disponible: "
UserComment?"
6bis) il y a aussi un champs "com" à l'intérieur de la partie jpeg (lire:
http://en.wikipedia.org/wiki/JPEG )
7) pour ntfs, voir si possible ajouter un "morceau" avec le nom!
8)
archiver un table MD5 <--> nom du fichier (& chemin)
8a) solution "msdos" (ligne de commande windows)
- gaffe à la prise en compte des fichiers cachés, système, etc selon les "option des fichiers"
9) pas de pb pour les zip (windows les développe mais pas la commande dir ni l'accès par vbs) donc on crée le MD5 du .zip seulement
- le .zip embarquant déjà le nom des fichiers, c'est moins important.
10) faut aussi associer au nom la date de l'opération pour faire face à des remplacements ou duplications.
11) faut non seulement éviter les junction cycliques, mais aussi les "raccourcis" (par exemple: "Mes documents" vers "documents") qui sortent deux fois le même fichier
12) ignorer la quarantaine de NAV qui n'est autorisé que à System!; fait par une reprise d'erreur
20100906: un premier jus: (.VBS)
- choisir un dossier et s'y placer par une fenêtre de commande
- Faire la liste des fichiers par la commande: dir /b /s c:\ > noms.txt
- placer dans ce dossier le programme md5.vbs ci dessous (de MD5 )
- placer dans ce dossier la dll xmd5 téléchargée ici: http://www.xstandard.com/en/documentation/xmd5/
- exécuter le programme
DoMd5SurListe
la récup qui va avec
- placer dans un dossier tous les fichiers récupérés (ne semble nécessaire de s'occuper des dossiers récupérés)
- en faire la liste
- passer md5 sur ce fichier en ajoutant un "séparateur" à la place de l'espace entre md5 et nom de fichier.
- mettre bout à bout les deux listes et les trier ce qui interclassera les lignes selon le hash md5 (les originaux seront devant le fichier récupéré)
feuille de route
- reste à écrire le .vbs qui se chargera de "mover" les fichiers récupérés.
- gérer le dir et la récursivité dans le programme lui même (évitera le passage par un fichier intermédiaire et la fenêtre de commande)
récursion par programme
DoMd5Recursif
maquette de récupération
DoMd5Recup
perfs: pour 200 Go : une dizaine d'heures