1 Conjunto de datos de exoplanetas
Se utilizaron datos de la API pública de la NASA con información de 1,621 exoplanetas. Después del preprocesamiento, se trabajó con 658 planetas con datos completos.
Estadísticas clave del dataset:
- Total de planetas inicial: 1,621
- Planetas después de limpieza: 658
- Planetas habitables: 0 (0%)
- Planetas no habitables: 658 (100%)
- Características por planeta: 5 (radio, masa, distancia, temperatura, tipo estrella)
2 Preprocesamiento de datos
Limpieza de Datos
Eliminación de registros con valores nulos o inconsistentes
Balanceo de Clases
Generación de datos sintéticos para equilibrar clases habitables/no habitables
Normalización
Estandarización de variables numéricas para el entrenamiento
Codificación
Transformación de variables categóricas (tipo de estrella)
3 Diseño de la red neuronal
Arquitectura de la Red
(5 características)
(64 neuronas)
(32 neuronas)
(1 neurona)
4 Configuración de la red
Capa de Entrada
5 neuronasCaracterísticas: radio, masa, distancia, temperatura, tipo estrella
Capas Ocultas
64 → 32 → 16Función de activación: ReLU
Dropout: 0.3 para regularización
Capa de Salida
1 neuronaFunción de activación: Sigmoide
Probabilidad de habitabilidad 0-1
5 Configuración del entrenamiento
Hiperparámetros utilizados:
- Optimizador: Adam
- Función de pérdida: Binary Crossentropy
- Métrica: Accuracy
- Épocas: 50
- Batch size: 16
- División train/test: 80%/20%
6 Progreso del entrenamiento
Precisión
Entrenamiento: 96.2%
Validación: 96.97%
Excelente rendimiento sin sobreajustePérdida
Entrenamiento: 0.16
Validación: 0.19
Convergencia estable y rápidaGráfico de precisión y pérdida durante el entrenamiento
7 Métricas de evaluación
Accuracy
Precisión general del modelo
Precision (0)
No habitables correctos
Precision (1)
Habitables correctos
Recall (0)
Detección no habitables
Recall (1)
Detección habitables
8 Matriz de confusión
| Predicción: No | Predicción: Sí | |
|---|---|---|
| Real: No | 66 | 0 |
| Real: Sí | 4 | 62 |
Interpretación: El modelo es excelente identificando ambos tipos de planetas, con solo 4 falsos negativos.
9 Predicciones para planetas conocidos
TRAPPIST-1e
Exoplaneta en zona habitable, potencialmente rocoso
Kepler-22b
Primer planeta en zona habitable descubierto por Kepler
Júpiter
Gigante gaseoso en nuestro sistema solar
10 Análisis de resultados
Puntos Fuertes
- Altísima precisión (96.97%)
- Excelente detección de planetas habitables (100% precision)
- Buen equilibrio entre entrenamiento/validación
- Arquitectura eficiente y efectiva
- Predicciones alineadas con conocimiento científico
Limitaciones
- Dataset original desbalanceado (ningún planeta habitable)
- Necesidad de generar datos sintéticos
- Falta de datos completos para muchos exoplanetas
- Características limitadas en los datos de la NASA
11 Interpretación científica
Contexto Científico:
"Los resultados reflejan el conocimiento científico actual: TRAPPIST-1e y Kepler-22b son considerados entre los planetas más prometedores para la habitabilidad, mientras que Júpiter es un gigante gaseoso claramente no habitable."
Implicaciones Técnicas:
El modelo demuestra que las redes neuronales pueden capturar patrones complejos en datos astronómicos, aunque la escasez de datos reales de planetas habitables presenta desafíos para el entrenamiento.
12 Aplicaciones futuras
Búsqueda de Exoplanetas
Priorización de candidatos para observación detallada
Misiones Espaciales
Selección de objetivos para futuras misiones de exploración
Investigación Astrobiológica
Identificación de planetas con condiciones potenciales para vida