Parte 1: Datos de Exoplanetas de la NASA
1 Conjunto de datos de exoplanetas

Se utilizaron datos de la API pública de la NASA con información de 1,621 exoplanetas. Después del preprocesamiento, se trabajó con 658 planetas con datos completos.

Estadísticas clave del dataset:
  • Total de planetas inicial: 1,621
  • Planetas después de limpieza: 658
  • Planetas habitables: 0 (0%)
  • Planetas no habitables: 658 (100%)
  • Características por planeta: 5 (radio, masa, distancia, temperatura, tipo estrella)
2 Preprocesamiento de datos
Limpieza de Datos

Eliminación de registros con valores nulos o inconsistentes

Balanceo de Clases

Generación de datos sintéticos para equilibrar clases habitables/no habitables

Normalización

Estandarización de variables numéricas para el entrenamiento

Codificación

Transformación de variables categóricas (tipo de estrella)

Parte 2: Arquitectura de la Red Neuronal
3 Diseño de la red neuronal
Arquitectura de la Red
Entrada
(5 características)
Oculta 1
(64 neuronas)
Oculta 2
(32 neuronas)
Salida
(1 neurona)
4 Configuración de la red
Capa de Entrada
5 neuronas

Características: radio, masa, distancia, temperatura, tipo estrella

Capas Ocultas
64 → 32 → 16

Función de activación: ReLU
Dropout: 0.3 para regularización

Capa de Salida
1 neurona

Función de activación: Sigmoide
Probabilidad de habitabilidad 0-1

Parte 3: Proceso de Entrenamiento
5 Configuración del entrenamiento
Hiperparámetros utilizados:
  • Optimizador: Adam
  • Función de pérdida: Binary Crossentropy
  • Métrica: Accuracy
  • Épocas: 50
  • Batch size: 16
  • División train/test: 80%/20%
6 Progreso del entrenamiento
Precisión

Entrenamiento: 96.2%

Validación: 96.97%

Excelente rendimiento sin sobreajuste
Pérdida

Entrenamiento: 0.16

Validación: 0.19

Convergencia estable y rápida

Gráfico de precisión y pérdida durante el entrenamiento

Época 1 → Época 50 (mejora continua)
Parte 4: Resultados y Evaluación
7 Métricas de evaluación
96.97%
Accuracy

Precisión general del modelo

94%
Precision (0)

No habitables correctos

100%
Precision (1)

Habitables correctos

100%
Recall (0)

Detección no habitables

94%
Recall (1)

Detección habitables

8 Matriz de confusión
Predicción: No Predicción: Sí
Real: No 66 0
Real: Sí 4 62

Interpretación: El modelo es excelente identificando ambos tipos de planetas, con solo 4 falsos negativos.

9 Predicciones para planetas conocidos
TRAPPIST-1e

Exoplaneta en zona habitable, potencialmente rocoso

99.60%
Kepler-22b

Primer planeta en zona habitable descubierto por Kepler

99.79%
Júpiter

Gigante gaseoso en nuestro sistema solar

0.37%
Parte 5: Conclusiones y Reflexiones
10 Análisis de resultados
Puntos Fuertes
  • Altísima precisión (96.97%)
  • Excelente detección de planetas habitables (100% precision)
  • Buen equilibrio entre entrenamiento/validación
  • Arquitectura eficiente y efectiva
  • Predicciones alineadas con conocimiento científico
Limitaciones
  • Dataset original desbalanceado (ningún planeta habitable)
  • Necesidad de generar datos sintéticos
  • Falta de datos completos para muchos exoplanetas
  • Características limitadas en los datos de la NASA
11 Interpretación científica
Contexto Científico:

"Los resultados reflejan el conocimiento científico actual: TRAPPIST-1e y Kepler-22b son considerados entre los planetas más prometedores para la habitabilidad, mientras que Júpiter es un gigante gaseoso claramente no habitable."

Datos de la NASA y comunidad científica
Implicaciones Técnicas:

El modelo demuestra que las redes neuronales pueden capturar patrones complejos en datos astronómicos, aunque la escasez de datos reales de planetas habitables presenta desafíos para el entrenamiento.

12 Aplicaciones futuras
Búsqueda de Exoplanetas

Priorización de candidatos para observación detallada

Misiones Espaciales

Selección de objetivos para futuras misiones de exploración

Investigación Astrobiológica

Identificación de planetas con condiciones potenciales para vida