Résumé
Après avoir donné quelques définitions du domaine de la data, l'autrice présente les fondements de Spark. Elle explique l'architecture logicielle du framework, les composants et les différents langages avec lesquels il est possible de développer.
Elle présente ensuite la transformation de données. Fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. Les lecteurs et lectrices pénétreront dans des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs et utilisatrices. Les nombreuses API de Spark sont parcourues. Cet apport théorique est appuyé par des exemples de code.
Dans un autre temps, l'apprentissage machine est dévoilé. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de paramètres étudiés. Les lecteurs et lectrices découvriront les différents algorithmes présents dans l'outil, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif. Des mises en pratique sont disponibles. Les arbres de décision, forêts aléatoires, réseaux de neurones, régressions linéaires et factorisations de matrices sont enseignés.
Dans le domaine de la préparation de données, le traitement des informations numériques ainsi que la vectorisation de textes sont présentés.
Dans le dernier chapitre, c'est l'industrialisation de Spark qui est mise en avant. Déployer, déboguer et tester son application sont autant d'éléments cruciaux qui sont balayés. Les lecteurs et lectrices apprendront les subtilités de l'outil pour une performance optimale.
L'auteur - Nastasia Saby
Autres livres de Nastasia Saby
Caractéristiques techniques
PAPIER | |
Éditeur(s) | Eni |
Auteur(s) | Nastasia Saby |
Parution | 17/01/2022 |
Nb. de pages | 308 |
Format | 18 x 22 |
Couverture | Broché |
Poids | 485g |
Intérieur | Noir et Blanc |
EAN13 | 9782409033780 |
Avantages Eyrolles.com
Consultez aussi
- Les meilleures ventes en Graphisme & Photo
- Les meilleures ventes en Informatique
- Les meilleures ventes en Construction
- Les meilleures ventes en Entreprise & Droit
- Les meilleures ventes en Sciences
- Les meilleures ventes en Littérature
- Les meilleures ventes en Arts & Loisirs
- Les meilleures ventes en Vie pratique
- Les meilleures ventes en Voyage et Tourisme
- Les meilleures ventes en BD et Jeunesse
- Informatique Systèmes d'exploitation UNIX
- Informatique Systèmes d'exploitation Linux
- Informatique Bases de données Produits SGBD MySQL
- Informatique Développement d'applications Technologies objet Programmation objet
- Informatique Développement d'applications Conception et développement web Serveurs web et serveurs d'application Apache
- Informatique Développement d'applications Langages PHP
- Informatique Développement d'applications Langages Python