Ciudadanía Digital · Algoritmos y Sesgo

Exploración del contenido 0 / 5 tarjetas

Análisis Argumentativo

❓

Pregunta Central

¿Los algoritmos son realmente imparciales? ¿Pueden tomar decisiones justas cuando son diseñados y entrenados por seres humanos con sesgos propios?

Haz clic para revelar →

📌

Tesis

Los algoritmos no son completamente imparciales porque dependen de humanos para su diseño y de datos históricos que pueden contener sesgos estructurales.

Haz clic para revelar →

✅

Argumentos

Haz clic para revelar →

⚖️

Contraargumentos

Haz clic para revelar →

🧾

Conclusión

Debemos usar los algoritmos de forma crítica y consciente, exigir transparencia en su diseño y promover regulaciones que garanticen que no reproduzcan ni amplifiquen desigualdades sociales.

Haz clic para revelar →

Evidencia Visual · Estadísticas

34,7%

Tasa de error en mujeres de piel oscura en reconocimiento facial

MIT Media Lab · Gender Shades 2018

4×

Más frecuente: mujeres descritas en roles domésticos por LLMs

UNESCO · 2024

71%

Empresas que admiten no auditar sus algoritmos de IA regularmente

MIT Sloan · 2022

29%

Mujeres y personas no binarias que trabajan en el sector tecnológico

Tech Talent Charter · 2024

Gráfico 1 · Barras Comparativas

Tasa de Error en Reconocimiento Facial por Grupo

Estudio Gender Shades · MIT Media Lab 2018

Fuente: Buolamwini & Gebru · proceedings.mlr.press/v81/buolamwini18a.html

Gráfico 2 · Distribución

Composición del Sector Tecnológico por Género

Tech Talent Charter UK · 2024

Fuente: Tech Talent Charter · Diversity in Tech Report 2024

Gráfico 3 · Líneas de Tendencia

Índice de Sesgo en Grandes Modelos de Lenguaje (LLMs) por Dimensión

Comparativa de modelos GPT-2, GPT-3.5 y Llama 2 · UNESCO 2024 · Escala 0-100 (mayor = más sesgo)

Fuente: UNESCO (2024) · Challenging systematic prejudices in large language models · unesdoc.unesco.org

Análisis Profundo · Explicación

Desequilibrio en los Datos de Entrenamiento

Los principales datasets usados para entrenar algoritmos de reconocimiento facial —como LFW, IJB-A y MS-Celeb-1M— fueron construidos raspando imágenes de internet: Wikipedia, noticias, redes sociales. Esas fuentes tienen una sobrerrepresentación histórica de personas blancas occidentales.

Un análisis del dataset IJB-A encontró que más del 80% de los rostros eran de piel clara. El modelo aprende a reconocer con mucho más detalle las variaciones del grupo mayoritario. Un rostro oscuro es estadísticamente "raro" para él.

La Física de la Luz y las Cámaras

Los sistemas detectan contraste entre rasgos: bordes de ojos, nariz, boca. Las cámaras fueron calibradas históricamente para tonos claros — desde las "Shirley cards" de Kodak (mujeres blancas usadas para calibrar color en el siglo XX) hasta los sensores actuales.

En piel oscura, el menor contraste relativo entre rasgos y piel confunde al algoritmo al detectar bordes, especialmente con iluminación subóptima. El modelo no aprendió a compensar esto porque sus datos tampoco lo hacían.

Quiénes Construyeron los Sistemas

El 80% de los investigadores de IA en laboratorios líderes son hombres, y la mayoría proviene de países donde la población predominante es de piel clara. Esto no implica mala intención, pero sí que los puntos ciegos son sistemáticos: si nadie en el equipo tiene la experiencia de ser mal reconocido, ese problema rara vez es prioridad.

"El sistema no me reconocía hasta que me puse una máscara blanca."

Joy Buolamwini · MIT Media Lab · Investigadora de Gender Shades

El Ciclo de Retroalimentación

Una vez desplegado, el sesgo se amplifica en cada iteración:

① El sistema falla más con piel oscura
→ Esas personas lo usan menos o confían menos en él
→ Se generan menos datos de ese grupo
→ El modelo se reentrena con aún menos diversidad
→ El sesgo se profundiza en cada ciclo

Esto lo demostró el estudio de la UCL (2024): la IA no solo reproduce sesgos, los exacerba en cada generación de reentrenamiento.

La Intersección de Género y Raza

Gender Shades demostró que el error no es solo racial: ser mujer multiplica el error, y ser mujer de piel oscura los acumula ambos.

Los datasets históricos también subrepresentan a mujeres, y los algoritmos aprendieron que el "rostro canónico" era masculino y de piel clara. La intersección de ambas variables produce el error máximo de 34,7%, frente al 0,8% en hombres de piel clara.

Métricas de Éxito que Ocultan el Problema

Un sistema con 95% de precisión global suena excelente. Pero si el 80% de los datos son piel clara, el algoritmo puede tener 99% de precisión en ese grupo y 60% en piel oscura, y la métrica global sigue siendo alta.

Esto es lo que se llama "precisión promedio engañosa": las métricas agregadas enmascaran discriminación sistemática. Es por eso que las auditorías deben desagregar los resultados por subgrupos.

🔑

No es que la tecnología sea intrínsecamente más "compatible" con piel clara. Es que fue diseñada, entrenada y probada predominantemente con piel clara, por equipos poco diversos, con herramientas —cámaras, datasets, métricas— que también heredaban ese sesgo. El resultado es un sistema que funciona bien para quienes se parecen a los datos con que aprendió, y mal para todos los demás. Es el ejemplo más claro de por qué el sesgo algorítmico no es un problema técnico aislado: es un problema social codificado en matemáticas.

Repositorios · Datasets de Entrenamiento

Gratuito

Kaggle Datasets

Plataforma líder con más de 250.000 datasets públicos. Incluye competencias ML, notebooks y datos de imágenes, texto, series de tiempo y más.

Visión NLP Series

Open Source

Hugging Face Datasets

Hub con más de 100.000 datasets listos para usar con PyTorch y TensorFlow. Ideal para NLP, visión computacional y audio.

LLM NLP Audio

🏛️UCI ML Repository

Académico

UCI ML Repository

Repositorio clásico de la Universidad de California Irvine. Referencia académica con más de 650 datasets estructurados para clasificación y regresión.

Tabular Clase. Regres.

🌐Google Dataset Search

Buscador

Google Dataset Search

Motor de búsqueda de Google especializado en datasets de todo internet. Indexa millones de conjuntos de datos de instituciones, gobiernos y universidades.

Buscador Todos

📷ImageNet

Visión

ImageNet

El dataset de imágenes de referencia mundial con 14 millones de imágenes etiquetadas en 21.000 categorías. Base del desafío ILSVRC que impulsó el deep learning.

Imágenes Deep L. CNN

🏢Data.gov

Gobierno

Data.gov (EE.UU.)

Portal de datos abiertos del gobierno de los Estados Unidos. Más de 300.000 datasets de salud, economía, educación, clima y ciencia.

Público Social Salud

🔬OpenML

Ciencia

OpenML

Plataforma colaborativa de ciencia abierta de ML con más de 4.000 datasets, 20.000 tareas y millones de resultados de experimentos reproducibles.

ML Benchmark Ciencia

🧬COCO Dataset

Visión

MS COCO Dataset

Common Objects in Context: 330.000 imágenes con 1,5 millones de objetos etiquetados. Estándar para detección de objetos, segmentación y subtitulado.

Detección Segmen. YOLO

🌍World Bank

Global

World Bank Open Data

Datos socioeconómicos globales del Banco Mundial: pobreza, educación, género, salud y más de 200 países. Ideal para estudios de sesgo social y equidad.

Social Equidad Global

🗣️Common Voice

Audio

Mozilla Common Voice

Dataset de voz multilingüe más grande del mundo con más de 30.000 horas en 100 idiomas. Construcción comunitaria abierta para modelos de reconocimiento de voz.

Audio NLP Multilingüe

Formación Ciudadana · Unidad Algoritmos y Sesgo

Objetivo de Aprendizaje

Andrew Churches · Taxonomía de Bloom para la Era Digital · 12 páginas · Eduteka

Mapa de la Taxonomía de Bloom para la Era Digital · Pág. 3 · Modo Horizontal

Haz clic en la imagen para ampliarla · Andrew Churches · edorigami.wikispaces.com

Robert J. Marzano · Nueva Taxonomía del Pensamiento (2001) · Framework for Teaching Ver en marzanoresources.com ↗

Niveles comparados lado a lado

Bloom Revisada (Anderson 2001)

6Crear — Diseñar, producir, construir

5Evaluar — Juzgar, criticar, revisar

4Analizar — Comparar, organizar, deconstruir

3Aplicar — Usar, ejecutar, implementar

2Comprender — Interpretar, inferir, explicar

1Recordar — Reconocer, listar, identificar

Nueva Taxonomía de Marzano (2001)

6Sistema del Yo — Motivación, eficacia, creencias

5Metacognición — Planificar, monitorear, evaluar el propio pensamiento

4Utilización del Conocimiento — Toma de decisiones, resolución de problemas

3Análisis — Correspondencia, clasificación, error, generalización

2Comprensión — Síntesis, representación

1Recuperación — Reconocimiento, recuerdo, ejecución

Diferencias clave entre ambas taxonomías

Dimensión	Bloom Revisada	Marzano
Enfoque central	Habilidades cognitivas del pensamiento, organizadas en niveles de complejidad creciente	Tres sistemas interactivos: cognitivo, metacognitivo y del yo (actitudes y creencias)
Dimensión afectiva	No incluida; se centra exclusivamente en el dominio cognitivo	Integrada como Sistema del Yo: motivación, eficacia personal y emociones
Metacognición	Implícita dentro de Evaluar y Crear; no es un nivel separado	Nivel explícito e independiente: monitorear, planificar y evaluar el propio pensamiento
Tipos de conocimiento	Distingue: factual, conceptual, procedimental y metacognitivo	Distingue: información, procedimientos mentales y procedimientos psicomotores
Uso en aula	Más difundida; ideal para redactar objetivos de aprendizaje y actividades con verbos	Más compleja; útil para diseño curricular profundo y evaluación del aprendizaje integral
Aplicación en este OA	Este objetivo usa Bloom porque permite definir con precisión el nivel cognitivo mediante verbos operacionales (Analizar, Identificar, Evaluar), lo que facilita tanto la comunicación del propósito a los estudiantes como la evaluación del logro.

¿Cuándo usar Marzano? Cuando el diseño curricular necesita incorporar variables motivacionales, autoeficacia o metacognición explícita como objetivos evaluables. Bloom es suficiente — y más operativo — cuando el foco está en definir qué habilidades cognitivas deben demostrar los estudiantes con una tarea concreta.

📚 Formación Ciudadana

🏫 3° / 4° Medio

🧠 Taxonomía de Bloom · Nivel 4

⚖️ Pensamiento Crítico

Analizar críticamente el funcionamiento y las implicaciones éticas de los algoritmos digitales, identificando las causas del sesgo algorítmico y sus efectos sobre distintos grupos sociales, mediante la evaluación de evidencia empírica, argumentos y contraargumentos, para emitir un juicio fundamentado sobre el rol ciudadano frente a las tecnologías que condicionan decisiones, noticias y oportunidades en la sociedad actual.

Aspecto 01

Habilidad Cognitiva

Analizar · Identificar · Evaluar — verbos de nivel 4 en la Taxonomía de Bloom que exigen descomponer, examinar y juzgar, no solo recordar o comprender.

Aspecto 02

Contenido Específico

Causas del sesgo algorítmico, efectos sobre grupos sociales, evidencia empírica documentada y estructura argumentativa (argumentos y contraargumentos).

Aspecto 03

Criterio de Desempeño

Emitir un juicio ciudadano fundamentado sobre tecnologías que condicionan decisiones reales, conectando el contenido con el ejercicio activo de la ciudadanía digital.

Bloom Nv. 4 · Análisis

Supera los niveles de Recordar, Comprender y Aplicar para alcanzar el Análisis: descomponer información en partes, identificar patrones, causas y relaciones, y construir juicios basados en evidencia. Nivel apropiado para Formación Ciudadana en enseñanza media.

Dataset

url

↗ Abrir

🔒 ¿Por qué algunos sitios no abren en el visor?

La mayoría de los sitios grandes como Kaggle y Hugging Face tienen configurado en sus servidores el header HTTP X-Frame-Options: DENY o Content-Security-Policy: frame-ancestors 'none', que le ordena al navegador bloquear cualquier intento de mostrarlos dentro de un iframe, sin importar cómo esté configurado el atributo sandbox.

Es una medida de seguridad estándar para prevenir ataques de clickjacking: técnica en que una página maliciosa embebe en un iframe invisible un sitio legítimo para engañar al usuario y capturar sus clics o credenciales.

Lo que ocurre visualmente es que el iframe intenta cargar, el navegador detecta el header de seguridad y lo bloquea silenciosamente sin lanzar un error visible. Por eso se detectan de inmediato y se muestra esta tarjeta informativa en su lugar.

📋 Estado de compatibilidad con visor iframe

Sitio	Estado	Razón
Kaggle	🔒 Bloqueado	`X-Frame-Options: DENY`
Hugging Face	🔒 Bloqueado	`CSP: frame-ancestors 'none'`
Google Dataset Search	🔒 Bloqueado	`X-Frame-Options` anti-CSRF
ImageNet	🔒 Bloqueado	`X-Frame-Options: SAMEORIGIN`
Data.gov	🔒 Bloqueado	Política de seguridad federal
World Bank	🔒 Bloqueado	Política institucional
Mozilla Common Voice	🔒 Bloqueado	`X-Frame-Options: DENY`
UCI ML Repository	✅ Embebible	Sin restricción de iframe
OpenML	✅ Embebible	Sin restricción de iframe
MS COCO	✅ Embebible	Sin restricción de iframe

Cargando recurso…

Caso Real · Análisis Ético

¿Qué ocurre cuando la empresa tecnológica más influyente del planeta usa su posición dominante en el mercado para forzar decisiones sobre millones de usuarios y fabricantes sin que nadie lo haya pedido? El caso de Windows 11 es la respuesta más documentada y actual que existe al sesgo algorítmico institucional: no es un error, es una estrategia.

240M

PCs con Windows 10 sin soporte desde octubre 2025, expuestos a vulnerabilidades

Microsoft · Estimación StatCounter 2025

8ª–10ª

Generaciones Intel excluidas de Windows 11 en 2025, a pesar de soportar TPM 2.0

Infobae · Febrero 2025

Recall

Función de IA que captura pantallas cada pocos segundos: rechazada globalmente por invasión de privacidad

Microsoft · 2024 · "Ha fracasado" internamente

2026

Microsoft reconoce que Copilot en Windows 11 fue "intrusivo" y retira botones que nadie pidió

Windows Central · Febrero 2026

Cronología de decisiones unilaterales

Octubre 2021

Lanzamiento de Windows 11 con requisito TPM 2.0

Microsoft lanza Windows 11 con una restricción de hardware sin precedentes: el chip TPM 2.0, ausente en millones de PCs perfectamente funcionales. Fabricantes y usuarios son excluidos sin explicación técnica convincente. El mercado de equipos de segunda mano colapsa.

2024
Copilot forzado en toda la interfaz + Recall: la captura de pantalla permanente
Microsoft integra Copilot en la barra de tareas, el Explorador de Archivos, las notificaciones y el navegador Edge sin consentimiento explícito. Simultáneamente lanza Recall, una función que captura pantallazos cada pocos segundos y los indexa con IA. La reacción mundial es de rechazo masivo por razones de privacidad.

Febrero 2025
Intel 8ª, 9ª y 10ª generación excluidas — aunque tienen TPM 2.0
Microsoft elimina de la lista de compatibilidad procesadores Intel que sí cumplen el requisito del TPM 2.0. La medida no tiene justificación técnica publicada. Fabricantes de gama media quedan sin opciones de hardware para vender equipos con Windows 11 oficial, forzando el encarecimiento de los precios.

Agosto 2025

Actualización a Windows 11 sin consentimiento en empresas

Administradores de sistemas reportan que equipos con Windows 10 gestionados por WSUS son actualizados a Windows 11 de forma automática sin autorización. Microsoft no emite comunicado oficial explicando el error.

Febrero 2026
Microsoft admite que Copilot fue intrusivo y retira botones
Windows Central, citando fuentes internas, revela que Microsoft está revisando profundamente la integración de IA en Windows 11. Internamente se reconoce que Recall "ha fracasado". La empresa pausa el desarrollo de nuevos botones de Copilot y los describe como excesivos. Llegan dos años tarde.

Análisis ético: ¿dónde está el sesgo?

🔒 Autonomía del usuario Violada

Funciones como Copilot y Recall se instalan activamente sin consentimiento explícito. Desactivarlas requiere navegar por múltiples menús de configuración, editar el Registro de Windows o usar scripts de terceros. El principio ético de que el usuario debe controlar su herramienta se invierte: la herramienta controla al usuario.

🏭 Sesgo hacia fabricantes ricos Comprobado

Al excluir procesadores económicos y gama media, Microsoft obliga a los fabricantes a usar hardware más caro. Esto impacta directamente en los mercados emergentes y en países donde los equipos de segunda generación son la norma. El sesgo no es racial ni de género, pero sí es económico y geográfico: los más afectados son los usuarios con menos recursos.

🕵️ Privacidad y vigilancia Alto riesgo

Recall captura pantallazos cada pocos segundos y los indexa. Copilot accede a archivos, historial y comportamiento del usuario. Investigadores descubrieron que Copilot podía evadir permisos en SharePoint y acceder a archivos encriptados. OneDrive escanea fotos con reconocimiento facial por defecto. Todo esto ocurre sin que el usuario promedio lo sepa.

🔄 Obsolescencia programada Cuestionable

Terminar el soporte de Windows 10 en octubre de 2025 dejó aproximadamente 240 millones de PCs funcionales sin actualizaciones de seguridad. No por fallas técnicas, sino por decisión comercial. El patrón se repite: crear urgencia de reemplazo para impulsar ventas de hardware. La brecha digital se amplía.

📢 Transparencia algorítmica Ausente

Microsoft no explicó por qué los Intel de 8ª a 10ª generación quedaron fuera si cumplen el TPM 2.0. No publicó los criterios de la lista de compatibilidad. No emitió comunicado sobre las actualizaciones automáticas no solicitadas. La opacidad sobre cómo sus algoritmos toman decisiones que afectan a millones es total.

🌍 Impacto medioambiental Ignorado

Forzar el reemplazo de millones de PCs funcionales genera toneladas de residuos electrónicos (e-waste). La huella de carbono de fabricar un nuevo dispositivo es entre 200 y 300 kg de CO₂. Microsoft no ha publicado ningún plan de compensación por el impacto ambiental de sus restricciones de hardware.

Reflexión crítica: ¿son imparciales los algoritmos de Microsoft?

La pregunta central de este trabajo — ¿son realmente imparciales los algoritmos? — adquiere una dimensión nueva cuando el algoritmo no es un modelo de IA entrenado con datos, sino el algoritmo de negocio de una corporación: el conjunto de decisiones codificadas en actualizaciones, requisitos de hardware y funciones predeterminadas que determinan qué usuarios tienen acceso, a qué precio y bajo qué condiciones.

El caso de Windows 11 demuestra que el sesgo algorítmico no requiere datos de entrenamiento sesgados. Basta con que las personas que diseñan el sistema tengan intereses que no coinciden con los intereses de quienes lo usan. Los ingenieros de Microsoft no eligieron discriminar por raza o género — eligieron optimizar para cuota de mercado, adopción de IA y venta de hardware. El efecto colateral es que los más perjudicados son los usuarios con menos recursos económicos, los países con mercados de segunda mano relevantes y los fabricantes que no pueden permitirse los procesadores de última generación.

Principio ético	Lo que debería ocurrir	Lo que ocurrió con Windows 11
Consentimiento informado	El usuario elige instalar cada función de IA con información clara	Copilot y Recall se instalan por defecto; desactivarlos requiere conocimientos técnicos avanzados
Transparencia	Los criterios de compatibilidad de hardware son públicos y justificados técnicamente	La exclusión de Intel 8ª–10ª generación no tiene justificación técnica publicada
No maleficencia	Las decisiones corporativas no deben dejar usuarios vulnerables sin alternativa	240 millones de PCs funcionales sin actualizaciones de seguridad por fin de soporte
Justicia distributiva	Los cambios tecnológicos no deben afectar desproporcionadamente a los de menor poder adquisitivo	Los más afectados son mercados emergentes y usuarios de gama media con equipos funcionales
Responsabilidad	La empresa reconoce y corrige los errores de forma oportuna y pública	Microsoft reconoció en 2026 que Copilot fue intrusivo — dos años después del lanzamiento
Privacidad por diseño	La recopilación de datos es mínima, opcional y claramente comunicada	Recall captura pantallazos permanentes; Copilot evade permisos; OneDrive activa reconocimiento facial por defecto

⚖️

El sesgo en Windows 11 no está en un modelo de lenguaje ni en un dataset desbalanceado. Está en las prioridades institucionales codificadas como decisiones técnicas: maximizar la adopción de IA, impulsar la renovación de hardware y expandir el ecosistema de suscripción de Microsoft 365, aunque eso implique violar la autonomía del usuario, amplificar la brecha digital y dejar millones de equipos funcionales sin soporte de seguridad. La pregunta ciudadana no es solo ¿son imparciales los algoritmos? Sino también: ¿a quién sirven las decisiones tecnológicas de quienes controlan la infraestructura digital de la que todos dependemos?

Mini Evaluación

Pon a Prueba tu Comprensión

Pregunta 1 de 10

Pregunta 01

✦

Evaluación Completada

Respuestas correctas

0/10

Porcentaje

Nota Final

1.0

Escala 1.0 – 7.0

✗ Reprobado · Aprobación desde 4.0 (60%)

0%60% · Aprobación100%

Institución	Tipo de recurso	Referencia
MIT Media Lab	Investigación Gender Shades · Reconocimiento facial	media.mit.edu/projects/gender-shades
UNESCO	Sesgo de género en grandes modelos de lenguaje (2024)	unesdoc.unesco.org/ark:/48223/pf0000388971
NIST (EE.UU.)	Evaluación de 189 algoritmos de reconocimiento facial	nist.gov/programs-projects/face-recognition
IBM · AI Fairness 360	Herramienta open-source de auditoría de sesgo algorítmico	aif360.mybluemix.net
Algorithmic Justice League	Activismo, investigación aplicada y recursos educativos	ajl.org
Tech Talent Charter (UK)	Diversidad e inclusión en el sector tecnológico	techtalentcharter.co.uk
Unión Europea · AI Act	Marco regulatorio de IA de mayor alcance global	artificialintelligenceact.eu
Journal of Financial Economics	Sesgo algorítmico en concesión de créditos bancarios (2021)	Disponible en JSTOR · SSRN