Este repositorio contiene un análisis detallado del famoso conjunto de datos del Titanic. El RMS Titanic, conocido por su trágico hundimiento en 1912, llevaba a bordo pasajeros de diversas clases sociales. Este proyecto explora los factores que pudieron haber influido en la supervivencia de los pasajeros durante el desastre.
El objetivo principal de este análisis es identificar patrones clave que puedan explicar las tasas de supervivencia en el Titanic y crear un modelo capaz de predecir el estado de supervivencia en función de variables como la edad, género, clase, puerto de embarque y tarifa. Este proyecto busca responder preguntas como:
- ¿Cuáles fueron los factores principales que contribuyeron a la supervivencia de los pasajeros?
- ¿Cómo influyeron el género, la edad y la clase del pasajero en las posibilidades de sobrevivir?
- Python: El análisis se ha realizado utilizando Python, un lenguaje de programación popular para el análisis de datos.
- Librerías de Python: Se han utilizado diversas librerías como Pandas para la manipulación de datos, Seaborn y Plotly.express para la visualización de datos, y Scikit-learn para el modelado predictivo.
- Jupyter Notebook: Los análisis y visualizaciones se presentan en un Jupyter Notebook para facilitar la comprensión y la reproducción del análisis.
- Titanic_analysis.ipynb: Jupyter Notebook que contiene el análisis detallado.
- Conclusiones.ipynb: Jupyter Notebook que contiene las conclusiones generales del análisis.
- titanic.cvs: Carpeta que contiene el conjunto de datos utilizado.
- Titanic_modificado: es el csv obtenido a partir del anterior con las modificaciones aplicadas durante el análisis.
- requirements.txt: documento de texto con todas las bibliotecas empleadas
- AppTitanic: es una aplicación sobre el proyecto creado con streamlit
- modeloRFC_Titanic.pkl: es el modelo de predicción elegido