Seleccionar página

Los programas electorales

Los partidos políticos basan su discurso, supuestamente, en la línea definida en sus programas electorales. En teoría, los programas electorales deberían ser los contratos que los partidos políticos firman con los ciudadanos, aunque en la práctica eso no ocurre. Nosotros no vamos a entrar a valorar cuánto realismo hay en los programas de los partidos, ni si una vez elegidos los representantes e investidos los presidentes (undecided) los programas se cumplen, por ahora. Lo que vamos a hacer es analizar los programas electorales desde un punto de vista separado de cualquier sesgo político.

Los programas electorales, en la mayoría de los casos, son documentos de texto y como texto se pueden analizar. Se puede empezar con el análisis más sencillo (considerando sólo sus palabras como átomos aislados) hasta llegar a análisis avanzados de sentimiento positivo/negativo o polaridad del discurso encerrado en cada frase o sección. Entre lo básico y lo avanzado hay unos cuantos métodos interesantes, y es lo que vamos a tratar de explicar en éste y otros posts relacionados.

¿Cómo se hace todo esto? Todo esto no es ni más ni menos que una de las múltiples aplicaciones del Procesamiento del Lenguaje Natural (NLP – Natural Language Processing) y se hace a través de técnicas y métodos de Aprendizaje Automático (Machine Learning) alimentados por datos. De hecho, cuantos más datos mejor.

¿Dónde están los datos?

Las palabras son nuestros datos, así de simple. Podemos ver las palabras como secuencias de letras, o convertirlas en números dependiendo del tipo de análisis, pero las palabras son definitivamente nuestros datos.

Frases están formadas por palabras, párrafos por frases, secciones de programas por párrafos hasta que finalmente el programa es una lista de secciones.

Partidos políticos a analizar

Esperamos que nadie se sienta agraviado: insistimos, este ejercicio no es un ejercicio de análisis político.

Tenemos que decidir qué analizamos, así que hemos decidido analizar el contenido de los programas de los 5 partidos políticos con mayor representación parlamentaria tras las últimas elecciones generales del 28-A: PSOE, PP, Cs, UP y VOX.

Vayamos al grano

Los programas electorales pueden tener una introducción para contextualizar lo que viene a continuación y un cierre recapitulando su contenido. Hemos decidido prescindir de las partes inicial y final para quedarnos con las secciones que definen el programa: los puntos programáticos.

La buena noticia es que los puntos programáticos son algo en lo que todos los partidos coinciden a la hora de organizar sus programas, así que también facilita la labor de análisis. Comencemos!

Ciudadanos (Cs) es el único partido para el que no hemos encontrado un documento formal de programa, sino que cuenta con una página web donde se detalla (aquí). Existe una versión de fácil lectura (aquí), pero cuenta con muy poco contenido. La línea programática de Cs se resume en 14 puntos:

 

  1. La España de ciudadanos libres e iguales
  2. Tolerancia cero con la corrupción
  3. Una economía moderna y competitiva para ganar el futuro
  4. Empleo del siglo XXI- un nuevo modelo laboral que ponga fin a la precariedad
  5. La educación, en el centro
  6. Turismo, cultura y deporte- poner en valor nuestro liderazgo
  7. Convertir España en el mejor país del mundo para las familias
  8. Una sanidad pública de calidad que garantice la igualdad
  9. Liderar la España del S.XXI- más libertad, más igualdad, más modernidad
  10. Cuidar nuestro país para nuestros hijos y nuestros nietos
  11. Un compromiso del Estado para combatir la despoblación
  12. Vivienda, infraestructuras y movilidad- políticas efectivas y sensatas
  13. Una política de Seguridad y Defensa adaptadas al siglo XXI
  14. Una España líder en una Europa más unida

El PP no parece haber elaborado un documento específico para las elecciones del 10-N, sino que nos remite en su directorio de programas (aquí) a un documento de 2019 que incluye su línea programática (aquí), y que se resume en 10 puntos:

 

  1. Comprometidos con el fortalecimiento de la nación
  2. Una revolución fiscal para el crecimiento económico y la competitividad
  3. Por una economía moderna y avanzada
  4. Por una educación de calidad y en libertad
  5. Más y mejor sociedad del bienestar
  6. Familia. Políticas sociales para la igualdad de oportunidades
  7. Más oportunidades para las personas
  8. Una España sostenible con futuro
  9. Una mejor democracia
  10. Retos globales de una sociedad abierta

El PSOE ha colgado en su página oficial (aquí) un documento específico con su programa completo para las elecciones del 10-N. Este documento se puede encontrar aquí. En él, se ha estructurado su línea programática en 6 puntos:

 

  1. Empleo justo y pensiones dignas
  2. Feminismo, lucha contra la desigualdad social y calidad democrática
  3. Emergencia climática y transición ecológica de la economía
  4. Avance científico, tecnológico y transición digital
  5. Estructura territorial
  6. España en Europa, España en el mundo

En el caso de UP sí hay un documento específico y completo para el 10-N (aquí), cuya línea programática se resume en 8 puntos:

 

  1. Horizonte Verde y Nuevo Modelo Industrial
  2. Horizonte Morado y Economía de los Cuidados
  3. Horizonte Digital y Nueva Economía
  4. Garantías Democráticas y de Ciudadanía
  5. Garantías de Justicia Laboral y Pensiones
  6. Garantías de Justicia Social
  7. Garantías de Justicia Fiscal
  8. Garantías de Justicia Territorial

En la página de programa electoral de VOX (aquí) no hemos encontrado una referencia expresa al 10-N en el programa que se publica (aquí). Este programa se desglosa en 10 puntos:

 

  1. España, unidad y soberanía
  2. Ley electoral y transparencia
  3. Inmigración
  4. Defensa, seguridad y fronteras
  5. Economía y recursos
  6. Salud
  7. Educación y cultura
  8. Vida y familia
  9. Libertades y justicia
  10. Europa e internacional

¿Qué hacemos con todo esto?

Ahora viene un poco de albañilería para poder disponer de nuestros datos (palabras). Hay muchas formas de hacer disponible la información para que se puedan utilizar las técnicas NLP. Nosotros hemos optado por una forma simple y que todo el mundo puede hacer: almacenar en un fichero de texto diferente (.txt) cada punto del programa de cada partido político.

Hay herramientas online que fácilmente convierten un fichero pdf o una página HTML en un fichero de texto. Con ese fichero pdf/HTML por partido político, el único trabajo «manual» que hemos hecho ha sido cortar cada punto programático y almacenarlo en un fichero individual. Se acabó el trabajo manual: no hay que volver a tocar los ficheros nunca más: – ¿ni para limpiarlos de caracteres extraños? Ni para limpiarlos de caracteres extraños. De eso ya se encargarán nuestros métodos.

Ficheros de programas por partido

Para todos aquellos que quieran hacer sus propios análisis con los ficheros de los programas políticos, aquí tenéis un fichero zip con las secciones programáticas por partido.

Procesamiento de los programas electorales

Ahora que tenemos los ficheros de los programas electorales en crudo, podemos procesarlos siguiendo una serie de pasos:

  1. Leer los ficheros, para formar un corpus y limpriarlo de caracteres extraños/no estándar. En este post explicamos el proceso.
  2. Dividir el corpus en palabras, ya que es la unidad que queremos utilizar para el análisis. Aquí hay un post que habla de ello.
  3. Limpiar el corpus de palabras vacías de significado, para dejarlo sólo con aquellas palabras que aportan. Aquí lo vemos.

Primer análisis: contar palabras

Aunque pueda parecer básico, un simple conteo de las palabras totales vs. palabras útiles del programa de cada partido nos puede dar alguna información interesante. Recordemos que las palabras útiles son las que aportan significado y para quedarnos con ellas simplemente hemos eliminado las stop words de nuestro corpus que contiene los programas electorales.

En el gráfico de abajo podemos ver cuántas palabras contienen los programas electorales de cada partido: desde las 3189 palabras de VOX a las 26651 palabras de UP. Las conclusiones las sacáis vosotros, nosotros sólo mostramos las diferencias y semejanzas que hay entre los diferentes partidos.

Un poco de lupa: ratio de palabras útiles

En la sección anterior podíamos ver de una forma más o menos clara cómo se repartía el porcentaje de palabras útiles respecto al total de palabras del programa de cada partido. Si lo visualizamos en forma de «donut», el resultado nos dice que el porcentaje va del 48,48% de palabras útiles de VOX al 52,81% de palabras útiles de UP.

Los datos crudos

Como referencia, podemos ver los números en crudo:

Palabras totales Palabras útiles
Cs 13142 6902
PP 23449 12216
PSOE 10420 5387
UP 26651 12921
VOX 3189 1684
Si te interesa el código, aquí lo tienes

Takeaway

Los programas electorales contienen abundante información para los ciudadanos, sean votantes activos o no. Al margen de ideologías políticas, de los programas se pueden extraer datos que ayuden a compararlos e identificar dónde se parecen más o donde se diferencian.

En este post hemos hecho un ejercicio sencillo, contar palabras, y ya hemos identificado diferencias y semejanzas entre partidos políticos, además de conocer qué porcentaje de palabras aporta poco significado a un discurso.

Cabe destacar que ya hemos hecho buena parte del trabajo tedioso de lectura y limpieza del corpus para poder afrontar análisis más avanzados en futuros posts.

 



Ver en Kaggle