Formation Cassandra
Découvrez La Formation Data Base Cassandra.
Présentation de la formation
Apache Cassandra est un outil de gestion de base de données de type NoSQL permettant le stockage et le traitement de très importants volumes de data, cette puissante solution en open source est adoptée par un nombre croissant d’entreprises.
Cassandra a été conçue pour être hautement scalable sur un grand nombre de serveurs tout en ne présentant pas de Single Point Of Failure (SPOF). Il fournit un schéma de données dynamique afin d’offrir un maximum de flexibilité et de performance.
Programme de la formation
Objectifs pédagogiques
- Connaître les apports de Cassandra par rapport à d’autres solutions existantes
- Savoir installer et configurer le SGDB Cassandra
- Pouvoir maîtriser le CQL
- Apprendre à administrer et sécuriser un cluster Cassandra
- Être capable d’effectuer des calculs distribués avec Spark
Pré-requis
- Avoir une connaissances générales sur les bases de données.
Contenu de la formation
Introduction
- Historique, fonctionnalités de Cassandra, licence
- Format des données, “Key-value”, traitement de volumes importants
- Haute disponibilité, système réparti de base de données, …
Installation Et Configuration
- Pré-requis
- Plates-formes supportées
- Étude du fichier de configuration : conf/cassandra.yaml
- Répertoire de travail, de stockage des données, gestion de la mémoire
- Démarrage d’un noeud et test de l’interface cliente cqlsh
CQL
- Commandes de base : connexion au système de base de données
- Création de colonnes, insertion, modification recherche
- Le CQL : Cassandra Query Language
- Exécution de scripts
- Comment écrire des requêtes ?
- Approches
- Limitations du CQL
Gestion De La Grappe
- Principe
- Préparation du premier noeud : adresse d’écoute
- Configuration de nouveaux noeuds
- Notion de bootstrapping et de token
- Paramètres listen_address et rpc_address
- Réplication : topologie du réseau et EndpointSnitch
- Stratégie de réplication
- Ajout de noeuds, suppression
- Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom-filter
- Travaux pratique : mise en place d’une configuration de production (multi-datacenters, multi-racks)
Supervision
- OpsCenter : installation, lancement et découverte
- Supervision avec nodetool cfstats
- Principe des accès JMX
- Exports JMX vers des outils de supervision comme Nagios
- Démonstration avec Prométheus et Kibana
Exploitation
- Gestion des noeuds Cassandra
- Sauvegardes, snapshots et export au format JSON
- Principe de cohérence, digest request et read repair
Support HADOOP
- Principe de map/reduce
- Implémentation Hadoop et implémentation Hadoop/Cassandra
Support SPARK
- Description rapide de l’architecture Spark
- Mise en oeuvre depuis Cassandra
- Exécution d’application Spark s’appuyant sur une grappe Cassandra
Performance
- Outil de test de performance Cassandra-stress
- Mise en place d’un plan de stress et paramétrage
Public
Devis
Infos Pratiques
Contactez Nous
prochaines formations
Comments are closed.