Les objectifs de la formation sont :
- les aspects méthodologiques (compression, apprentissage artificiel, recherche d'information...)
- répondre à ces défis et les technologies permettant d'appliquer ces méthodes à grande échelle
La formation s'adresse au :
Pré-requis :
Le programme de la formation :
BigData, architectures et langages
- Big data, qu’est ce que c'est, où l'on utilise (détection de fraudes, analyse prédictive...).
- Hadoop et Map Reduce architecture.
- Apache Spark, storm au delà de Hadoop et Map Reduce
- Produits que l'on trouve souvent dans l'environnement Big Data, flume, hive...
- Les distributions Big Data, Cloudera, hortonworks et DataStax pour "professionnaliser" le Big Data.
- Présentation bases no SQL, document (MongoDB) vs clé, valeur (Cassandra)
- Introduction au langage R.
- TP pratique, avec un test rapide sur du Cloudera, et un autre sur Datastax (Cassandra).
Big Data et contenus multimédia
- Principes, outils en compression pour gérer de très grands volumes de données multimédia.
- Principe de la Recherche d’Informations
- Texte
- Statistiques sur la langue (Luhn, tf-idf...)
- Modèles de recherche d'information (booléen, vectoriel, modèles de langue...?)
- Indexation : index inversé
- Le cas du web (Pagerank...)
- Image
- Représentation par la couleur (histogrammes et variantes)
- Représentation par la texture/forme
- Video
- Structuration vidéo
- Représentation du mouvement
Techniques d’apprentissage pour le Big Data
- Problématiques (annotation de contenus...)
- Apprentissage non supervisé (k-means...)
- Apprentissage supervisé (Bayes, ANN, SVM...)
- Fouille de données
Cette formation est en mode présentiel dans nos locaux de Lille :
- 4 semaines de présentiel.
Soit 120 heures de formation sur 1 mois.
Les dates sont :
Semaine : Nous consulter
Le tarif de la formation est de :