Réplication de bases de données sur site (DMS)
La réplication de bases de données sur site utilise AWS Database Migration Service (DMS) pour répliquer continuellement les données de vos bases de données sur site vers votre entrepôt cloud BEEM. Idéal pour les organisations dont les données ne sont pas accessibles via des connecteurs API standards.
Disponibilité
La réplication de bases de données sur site est disponible sur le plan Enterprise, ou en tant que module complémentaire payant pour les autres niveaux.
Step 1: Identifier votre base de données source
- Déterminez quelle base de données sur site vous devez répliquer :
- SQL Server
- PostgreSQL
- MySQL
- Oracle
- Autres bases de données supportées
- Notez la version, la taille et l'emplacement réseau de la base de données
Step 2: Établir la connectivité réseau
- Une connexion VPN entre votre réseau et BEEM est généralement requise (voir l'article VPN)
- Alternativement, un Database Bridge ou Cloud Connect peut fournir l'accès
- Assurez-vous que la base de données source autorise les connexions depuis l'environnement BEEM
- Travaillez avec votre équipe réseau pour ouvrir les ports requis
Step 3: Contacter BEEM pour la configuration
- Contactez support@beemdata.com ou votre gestionnaire de compte BEEM
- Fournissez :
- Type et version de la base de données source
- Tables ou schémas à répliquer
- Méthode de connectivité réseau (VPN, Database Bridge, etc.)
- Fréquence de réplication souhaitée
- L'équipe BEEM configure la tâche de réplication DMS
- Fournissez :
Step 4: Valider la réplication
- Surveillez le chargement initial complet dans la section Monitor
- Vérifiez les données dans le Datalake une fois la synchronisation initiale terminée
- Confirmez que la capture de données modifiées (CDC) fonctionne pour les mises à jour en quasi-temps réel
Fonctionnement
- Chargement complet (Full Load) : Copie initiale complète des tables sélectionnées
- Capture de données modifiées (CDC) : Réplication continue des insertions, mises à jour et suppressions
- Les données arrivent dans votre entrepôt BEEM dédié, prêtes pour la transformation dans le Warehouse
- La surveillance automatisée détecte et signale les problèmes de réplication
Détails clés
- Nécessite une connectivité réseau (VPN, Database Bridge ou Cloud Connect)
- Supporte la plupart des bases de données relationnelles majeures
- La consommation DMS est suivie dans le cadre de votre utilisation de DPU
- L'équipe BEEM gère l'infrastructure de réplication