Bonjour,
Je dois créer une base de données de A à Z. Je connais la méthode avec le schéma conceptuel (SC), logique (SL) et physique (SP).
Néanmoins, cela paraît moins évident en pratique :
J'ai des données de sources différentes. Je dois vérifier ces données, les nettoyer, les compléter, les connaître (ex : longueur du char) pour définir le SC.
Ex : fichier excel ou .txt contenant des adresses. Je dois vérifier si les codes postaux sont tous présents, s'ils sont corrects (notamment, en les comparant à une base de référence, celle de La Poste en opendata).
Comment est-ce que j'intègre les données ? En faisant d'abord un SC/SL/SP avec toutes mes données puis en faisant la vérification des données ?
En faisant un SC/SL/SP entre un fichier de données et un fichier de référence, en nettoyant puis en réajustant le SC/SL/SP ? Ainsi de suite avec chaque fichier à vérifier ? Enfin, quand deux fichiers de données sont vérifiés, les intégrer dans un SC/SL/SP commun (LA base de données).
Ou est-ce autrement ?
En effet, il y a un problème : pour utiliser du SQL pour vérifier la donnée (par ex, s'il y a redondance dans la donnée), il faut intégrer le fichier dans le SGBD. Cette étape est le SP. Or, il faudrait avoir le SC et SP en amont. Mais comment faire ces schémas sans avoir vérifier les données.
Merci par avance
Partager