Apprendre la Data Science avec R
What you'll learn
- Analyser et explorer tout type de jeux de données de manière complètement autonome.
- Charger et manipuler des données de manière optimale avec dplyr.
- Créer des visualisations graphiques professionnelles avec ggplot2.
Course content
- Preview07:04
- Preview03:55
- Preview06:22
Requirements
- Vous devez être capable d'utiliser un ordinateur et d'installer un logiciel.
- Aucune connaissance en statistique ou data science n'est requise.
Description
En partant de zéro, ce cours vous apprendra les bases des data sciences, en vous appuyant sur le langage R et des cas concrets utilisant des données réelles.
Après avoir installé R et découvert l'outil RStudio, nous progresserons rapidement à travers les différentes structures de données existantes. Peu à peu, la théorie laissera alors la place à des exercices de plus en plus concrets. Nous étudierons un jeu de données présentant des indicateurs de développement sur tous les pays du monde depuis 1960.
Au début simplifiées, ces données s'étofferont en même temps que vos compétences, jusqu'à ce que vous puissiez vous-même, de manière autonome, réaliser une analyse de données complète.
C'est alors que nous passerons à la visualisation graphique, compétence indispensable au data scientist pour communiquer ses résultats à son équipe, sa hiérarchie, ou même au grand public pour le data journalist :)
Pourquoi apprendre R ?
R est, avec Python, le langage le plus utilisé en data science. À l'origine inventé par des statisticiens et pour des statisticiens, il a su s'enrichir et se développer face aux progrès du domaine. Étant complètement libre, de nombreux data scientists développent de nouveaux packages pour intégrer tous les nouveaux modèles et algorithmes des data sciences.
R était à l'origine surtout utilisé dans le monde académique, mais sa croissance phénoménale, sa puissance grandissante, et son côté libre, lui ont permis peu à peu d'intégrer les services de data science des plus grandes compagnies, telles Google, Facebook, Airbnb, mais aussi EDF, La Poste, ou Renault, en France.
Objectifs de ce cours
L'objectif de ce cours est de vous rendre autonome dans l'analyse de données. Une fois terminé, vous serez capable de :
- Trouver le jeu de données qu'il vous faut sur internet (je vous donne de nombreuses sources).
- Charger ces données dans R.
- Trouver les réponses aux questions que vous vous posez en analysant ces données.
- Communiquer vos résultats à l'aide de graphiques à l'aspect professionnel.
- Et donc créer votre propre portfolio !
Ce cours est en constante évolution
Mon objectif est de faire de ce cours le meilleur possible afin que vous puissiez lancer le plus rapidement votre carrière de data scientist.
Voilà pourquoi je compte continuer à l'étoffer au fil du temps selon le feedback et les demandes vous me ferez. Ça peut passer par ajouter du nouveau contenu ou bien refaire de l'ancien contenu que vous jugez peut-être confus ou trop bref.
N'hésitez donc surtout pas à me dire si :
- Vous pensez qu'un thème que je n'ai pas abordé devrait l'être,
- Vous trouvez qu'un sujet est traité trop rapidement et vous aimeriez avoir de plus amples explications,
- Vous aimeriez plus d'exercices sur un sujet en particulier.
Bon courage :)
-- Charles
Who this course is for:
- Vous êtes débutant en data science.
- Vous n'avez jamais ou presque utilisé R.
- Vous souhaitez apprendre à faire "parler la data" avec R.
- Vous êtes prêt à investir votre temps et énergie dans un nouveau challenge.
- Vous souhaitez avoir un rôle professionnel plus orienté sur la data.
Instructor
Hey ! Je m'appelle Charles Bordet et je suis freelance en data science basé à Lyon.
Quand j'ai terminé mes études en statistique il y a plusieurs années, j'avais bien eu quelques cours en R, SQL, etc., mais mes connaissances étaient surtout théoriques.
Aucun problème quand il s'agissait de calculer la variance d'un estimateur, sa loi, et établir un intervalle de confiance.
Mais quand il fallait analyser de vraies données, j'étais complètement perdu... J'avais bien quelques bases en R, mais mon code était affreux et je n'arrivais de toute façon pas à faire ce que je voulais.
Je me suis donc formé en auto-didacte à l'aide de livres et de cours sur internet, j'ai même repris des cours, et puis peu à peu, j'ai inversé la tendance et j'ai commencé à moi-même donner des cours. D'abord comme chargé de TD à l'université, puis comme formateur à des professionnels.
J'ai pris de plus en plus goût à la formation, et à présent je me lance dans la réalisation de cours en ligne sur Udemy. Je me suis aperçu que l'offre française était plus que limitée. Je trouve ça assez intimidant de parler devant la caméra à potentiellement des centaines ou milliers d'apprentis data scientists, mais j'espère que vous trouverez mes cours utiles et qu'ils vous permettront de réaliser vos objectifs !