Bonjour,
Je suis en train d'essayer de réaliser une modélisation en étoile pour une base de donnée destinée au reporting.
Pour cela je compte créer un job talend qui puisera régulièrement (généralement 1 fois par jour) dans une base de production d'un logiciel que j'ai moi-même écrit, puis à partir de cela, une deuxième base de donnée avec un schéma en étoile sera populée.
Je n'ai pas vraiment de formation consistante en BI, dans un premier temps les requêtes qui attaqueront la base de production seront du SQL standard relationnel.
En fait mon problème est que je ne sais pas trop quelles sont les bonnes pratiques lorsqu'on en vient aux modifications de données.
Je m'explique, si un client change d'adresse, et que mon schéma contient une dimension géographique, Ok les nouveaux faits de vente pour ce client pointeront vers un autre enregistrement géographique que les précédents. Ce cas me convient.
Mon problème est surtout le suivant : les filles qui travaillent dans les magasins saisissent les clients mais il arrive que les informations du client soient complétées ou mises à jour plus tard (plusieurs jours plus tard), il arrive aussi qu'on fasse une erreur de saisie (nom-prénom mal orthographié, date de naissance non indiquée) et qu'on ne rectifie la donnée que le lendemain, ou la semaine suivante.
Dans ce cas je pense que ce serait pas si mal si l'ETL pouvait systèmatiquement updater certaines données dans mon schéma en étoile afin de tenir compte des corrections effectuées, dans le sens ou si j'ai un nouveau fait de vente à importer, je peux aussi forcer un update sur certains champs du client comme son nom par exemple.
D'un autre coté je suis tombé sur un article qui disait que les modifications de données importées dans une base d'analyse étaient la main droite du diable ou alors la résultante d'un design pauvre.
Je suis donc obligé de vous demander comment vous pensez que je devrai manager ceci?
Merci d'avance....
Partager