DIA 5 - Python for Data Analysis : Final Project

Drug Consumption Dataset - Analysis & Predictions

Cyprien NICOLAY - Timothé VITAL - Anna ZENOU

https://archive.ics.uci.edu/ml/datasets/Drug+consumption+%28quantified%29#

Pour ce projet, nous avons étudié un dataset sur les consommations de drogues. Nous avons choisi de travaillé sur un problème de classification binaire pour classer les individus dans le classe "a déjà testé" (valeur 1) ou "n'a jamais testé" (valeur 0). Ce problème peut s'appliquer à chacune des drogues.

Nous avons réalisé un code Python sur Jupyter dans lequel nous avons effectuer plusieurs tâches :

Data pre-processing: encoding, normalization, imputation…
Data visualization (avec matplotlib, seaborn ...): pour visualiser l'ensemble des informations du dataset et montrer des éventuels liens entre les variables et la cible.
Modeling: application de plusieurs algorithmes de Machine Learning (avec la librairie scikit-learn) pour prédire des résultats sur certaines drogues (nous avons choisi de nous concentrer sur le cannabis, l'ecstasy, les champignons hallucinogènes et le LSD).

Nous avons aussi expliqué les différents aspects du problèmes ainsi que les différentes étapes que nous avons suivi à l'aide d'une présentation PowerPoint (surtout utile pour illustrer nos propos lors de notre présentation orale).

Enfin, nous avons transformé notre modèle en API pour obtenir une meilleur interface.

Conclusions

En comparant les résultats des différents algorithmes utilisés, on remarque que c'est l'algorithme de Random Forest qui nous donne les meilleurs prédictions. Nous pouvons donc prédire à près de 80% si une personne a déjà consommé du cannabis, du LSD, de l'ecstasie ou des champignons hallucinogènes en fonction des données sur sa personnalité et ses caractéristiques démographiques.

/!\ N.B. /!\

Un de nos graphique ne s'affiche pas sur github mais il se trouve dans la slide 10 de la présentation et ci-dessous :

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
API_projet_python		API_projet_python
FINAL_PROJECT_DRUGS.ipynb		FINAL_PROJECT_DRUGS.ipynb
README.md		README.md
SLIDES_FINAL_PROJECT.pdf		SLIDES_FINAL_PROJECT.pdf
drug_consumption.data		drug_consumption.data

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DIA 5 - Python for Data Analysis : Final Project

Drug Consumption Dataset - Analysis & Predictions

Cyprien NICOLAY - Timothé VITAL - Anna ZENOU

Conclusions

/!\ N.B. /!\

About

Releases

Packages

Contributors 2

Languages

annazzenou/Python_Final_Project_Drugs

Folders and files

Latest commit

History

Repository files navigation

DIA 5 - Python for Data Analysis : Final Project

Drug Consumption Dataset - Analysis & Predictions

Cyprien NICOLAY - Timothé VITAL - Anna ZENOU

Conclusions

/!\ N.B. /!\

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages