Présenté à l’hôtel Renaissance La Défense, et co-organisé par Invivoo (www.invivoo.com).
Agenda
-
18h45 - 19h00 : Accueil des participants
-
19h00 - 19h30 : Hybrid batch and stream processing - meeting the global business requirements of an organization (Marcos ALMEIDA, Senior Developper - Invivoo)
-
19h30 - 20h00 : Curing the Kafka Blindness with SMM (Abdelkrim Hadjidj, Solution Engineer - Hortonworks)
-
20h00 - 20h30 : Apache Kafka 2.0 : New Features you probably didn’t know about! (Stephane Maarek, CEO - DataCumulus)
-
20h30 - 21h00 : Apéro
Présenté par Marcos ALMEIDA, Senior Developper - Invivoo
There’s an increasing pressure on leveraging enterprise data on improving business processes and/or products.
In companies that didn’t make the full transition from a small to a big data infrastructure, accessing company data requires the integration of a mix of tools, from batch systems, through private grids, to cutting edge big data enabled systems.
Une présentation du logiciel XComponent Koordinator édité par Invivoo.
Koordinator est axé sur les populations métier (qui n’a pas envie de faire du Go pour se servir de l’outil)
Code de la demo : https://github.com/xcomponent (dans un sous-répertoire)
Présenté par Abdelkrim Hadjidj, Solution Engineer - Hortonworks
Companies who use Kafka today struggle with monitoring and managing Kafka clusters.
Kafka is a key backbone of streaming analytics applications. The challenge is understanding what is going on overall in the Kafka cluster including performance, issues and message flows.
No open source tool caters to needs of different users that work with Kafka: DevOps/developers, platform team and security/governance teams.
In this talk, we will see how the new Hortonworks Streams Messaging Manager (SMM) enables users to visualize their entire Kafka environment end-to-end and simplifies Kafka operations.
DPS - DataPlane Service : La 3e et dernière offre côté Hortonworks
SMM - Streams Messaging Manager : pour de l’administration de clusters Kafka
Tout passe de nouveau par Knox comme Gateway.
Tous les services sont des containers Docker.
De bons outils de monitoring des clusters Kafka :
-
gestion des topics, avec données entrées et sorties
-
visualisation des consumers branchés aux topics
Changement de licence chez Hortonworks pour DPS : passage en licence RedHat
→ le source est disponible sur GitHub, mais le binaire compilé n’est pas fourni (mais rien n’empêche de le compiler soi-même à partir des sources)
SMM fonctionne via un agent, qui, apparemment (cf speaker), consomme peu de ressources, et donc n’impacte pas le fonctionnement de Kafka.
SMM n’est finalement qu’un outil de monitoring de Kafka, utilisant l’API même de Kafka.
D’autres outils existent pour répondre à ce besoin (même si peu nombreux) :
-
chez Confluent
-
chez Yahoo
Valeur Ajoutée de SMM et DPS par rapport à un "simple Kafka Manager" :
-
gestion d’ACL avec Ranger
-
gestion de la gouvernance avec Atlas
-
et maintenant gestion de Kafka avec SMM
Au final, Hortonworks continue de développer sa stratégie visant à couvrir / industrialiser au maximum l’ecosystème Data (via la création de multiples outils évitant la manipulation bas niveau des briques techniques)
Présenté par Stephane Maarek, CEO - DataCumulus
Apache Kafka is notorious for being a stable project that doesn’t change much over the releases.
Nonetheless, once in a while, a major improvement will happen, and you probably won’t have heard about it.
In this session, Stephane will introduce you to the various improvements and features Kafka 2.0 has had over the past year, some of which you may know… and some of which you may not know!
Rah ! Arnaque ! En fait le speaker n’a pas eu le temps de préparer ce sujet, et va finalement parler de sécurité avec Kafka.
Si votre Kafka est déjà sécurisé (car wrapped dans la suite HDP par exemple), pas la peine d’aller plus loin 😉
Commment sécuriser son Kafka ?
-
Encryption
-
Authentication
-
Authorization
-
Be aware that SSL lowers the performance of your brokers, and it’s quite a big price
→ Solution : end-to-end encryption
Who implements end-to-end encryption?
-
Closed source (so sad) : Apple
-
Open Source : Quicksign Kafka-encryption
-
SSL authentication : 2 way client authentication
→ Hard to revoke -
SASL (SImple Authentication and Security Layer)
-
SASL/GSSAPI - Kerberos : nearly Microsoft as an implementation
Very very hard to setup, errors are cryptic -
SASL/PLAIN
-
SASL/SCRAM-SHA-256/512
-
SASL/OAUTHBEARER
-
Automate ! The key word in security (in Kafka only ?)
Stephane a créé le Kafka Security Manager pour cela (github simplesteph kafka-security-manager)
librdkafka for Kafka CLIENT Security and NON Java clients (for Java clients, it works rather well)
Default Kafka clients have EVERY security options available !
→ Your client will only use 1 security setup, so create your own wrapped custom Kafka client…
Again automate! Once it works once, DOCKERIZE!
→ once done, it will work each time
→ Stéphane est un très bon speaker, et fait apparemment de très bon cours sur Udemy