Diabetes Prediction Using Machine Learning

This project demonstrates how to predict diabetes using various machine learning models. By leveraging Python's powerful data science libraries, we import and analyze the data, preprocess it, and then build and evaluate several predictive models.

Key Features

Data Collection & Analysis: Load and explore the diabetes dataset.
Data Visualization: Use plots to understand data distribution and relationships.
Preprocessing: Handle missing values, encode categorical variables, and scale the data.
Model Training: Train multiple machine learning models to predict diabetes.
Model Evaluation: Assess model performance using accuracy, confusion matrix, and classification report.
Model Comparison: Compare the performance of different models using ROC curves and accuracy scores.

Components

Python libraries: NumPy, pandas, seaborn, statsmodels, matplotlib, scikit-learn, xgboost, and missingno.
Jupyter Notebook for interactive data analysis and model building.

How It Works

Import Dependencies: Import necessary libraries for data manipulation, visualization, and modeling.
Data Collection & Analysis: Load the diabetes dataset and explore its structure, including checking for missing values and basic statistical measures.
Data Visualization: Plot various features to understand their distributions and relationships.
Data Preprocessing: Handle missing values by replacing them with median values based on the target variable (Outcome).
Data Scaling: Scale the data using StandardScaler and RobustScaler.
Model Training: Train various models including Logistic Regression, KNN, SVM, Decision Tree, Random Forest, Gradient Boosting, and XGBoost.
Model Evaluation: Evaluate the models using accuracy, confusion matrix, and classification report.
Model Comparison: Compare models' performance using ROC curves and accuracy scores.

Name		Name	Last commit message	Last commit date
Latest commit History 68 Commits
IQR.jpeg		IQR.jpeg
Main.ipynb		Main.ipynb
PE_diabetes.jpeg		PE_diabetes.jpeg
README.md		README.md
diabetes.csv		diabetes.csv
diabetes.pkl		diabetes.pkl
roc_diabetes.jpeg		roc_diabetes.jpeg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Diabetes Prediction Using Machine Learning

Key Features

Components

How It Works

About

Releases

Packages

Languages

sudarshan-krishnan/Diabetes-Prediction

Folders and files

Latest commit

History

Repository files navigation

Diabetes Prediction Using Machine Learning

Key Features

Components

How It Works

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages