Lorsque Hélène Georger-Vogt fut nommée responsable des archives De Dietrich en 1980, elle s’est attelée immédiatement à la sauvegarde et l’inventaire des 160 cartons.
Elle a réalisé un énorme travail, pendant de nombreuses années, avec pour résultat 60 fichiers MS Word, de format et présentation conforme à l’époque et aux outils disponibles, rédigés d’une manière littéraire (titre, sous-titres, présentation fluctuante...), cependant digne d’éloge pour le travail accompli.(voire un extrait du carton n° 1).

Les outils de l’époque ne permettaient pas d’autre résultat, mais cela pose un grand problème : ces fichiers ne permettent pratiquement aucune recherche, aucun dépouillement un peu automatisé. Les générations de chercheurs qui se sont penchés sur les archives De Dietrich se souviennent tous avec effroi de cet inventaire.
Afin de rendre ces informations, importantes en tant que telles, mieux utilisables il faut essayer de les "formater", c’est à dire de mettre toujours les mêmes informations au même endroit et sous la même forme.

Ce traitement a été obtenu avec un petit programme informatique, ne prenant pas encore en compte tous les détails, mais permettant de tester la faisabilité de l’opération. Le résultat est un ensemble d’informations structuré, disponible pour des manipulations ultérieures, comme, par exemple, la création de base de données (voir le résultat du test de formatage).
Avant d’essayer de traiter numériquement les informations, il faut les mettre en forme pour les rendre « exploitables », nous avons vu un exemple ci-dessus avec les archives De Dietrich.
Une fois "formaté", on peut essayer d’appliquer différents traitements de recherche, exemple sur la photothèque de la SHARE : les créateurs de la photothèque ont fait un très gros travail d’identification et de marquage des photos recueillies. Toutes les informations sont enregistrées dans le nom des fichiers.

Sur cette base, on peut très rapidement et facilement faire un comptage des mots, pour essayer de détecter les temps forts du corpus. Dans ce cas, le résultat n’est pas significatif, aucun thème ne se détache par une fréquence importante, on trouve bien certains termes plus fréquents, comme « foyer » (90) ou Schmelz (86), mais cela n’apporte pas d’information pertinente.
Remarque : l’absence d’information est aussi une information, dans notre cas cela montre que la photothèque concerne bien l’ensemble de Reichshoffen sous toutes ses formes.
Un traitement simple permet de transformer les noms de fichiers en tableau EXCEL facilement manipulable :

On retrouve dans ce tableau toutes les informations utiles, la catégorie, le type, le détenteur, le titre et éventuellement la date. Ceci est un premier pas, permettant déjà de faciliter les recherches simples.
Un pas suivant est de détailler ces informations, par exemple sur les noms de famille. Ici nous avons la chance que les concepteurs aient indiqué les noms de famille en majuscule, ce qui nous facilite le pointage.

Dans l’exemple (partiel) on retrouve presque 50 Wackermann, et 28 Grussenmeyer !
Remarque : ne jamais prendre pour argent comptant les résultats d’un traitement, il faut toujours essayer un autre test et/ou vérifier et revérifier la vraisemblance des résultats.
Dans l’exemple il n’y a pas 50 photos de la famille Wackermann, mais un grand nombre de photos ont été prises devant « l’épicerie Wackermann » ou le « restaurant Wackermann ». Ce nom indique donc ici un lieu et non une famille.
De même, certaines familles sont très étendues et anciennes dans la ville, et sont donc souvent citées. Par exemple, pour Grussenmeyer l’on trouve :
• Menuiserie GRUSSENMEYER
• Epicerie Louis GRUSSENMEYER
• F. GRUSSENMEYER, député maire
• Marie GRUSSENMEYER
• Bernardine GRUSSENMEYER
• Joseph GRUSSENMEYER (garde champêtre)
• Joseph GRUSSENMEYER (vicaire général)
• Antoine GRUSSENMEYER (curé ?)