Photo credit: agsandrew
Procesamiento de Lenguaje Natural
En esta dimensión hemos filtrado las entradas de nuestro blog para quedarnos con aquellas relacionadas con el Procesamiento de Lenguaje Natural (NLP). Aquí nos centramos en los conceptos y métodos para tratar y analizar textos de manera automática en castellano. Podrás encontrar todo tipo de ejemplos que te ayudarán a entender las técnicas y facilitar el análisis de textos en lenguaje natural.
Tienes la posibilidad de ver las entradas de nuestro blog filtradas por la dimensión de Visualizaciones.
Recuerda que nuestro logo siempre te llevará al Origen.
Moción de censura: la palabra de Abascal contra la de Casado
Hemos utilizado varias técnicas de Procesamiento de Lenguaje Natural, como BOW o TF-IDF, para analizar los discursos de Abascal y Casado.
Elecciones 10-N: distinguir las gotas de agua en los programas con Scattertext
Para finalizar la serie de las Elecciones 10-N, vamos a comparar las palabras más frecuentes de cada partido contra las más frecuentes del conjunto del resto de partidos.
Elecciones 10-N: los partidos dan su palabra con frecuencia
Encontrar las palabras que caracterizan un documento no es sencillo, y requiere métodos que ponderen las apariciones de las palabras de una forma consistente en los diferentes documentos que componen el corpus.
Elecciones 10-N: bolsa llena, quita las penas
El concepto de Bag of Words (BOW) es tan simple como parece: se trata de asignar un identificador único a cada palabra distinta de nuestro corpus y contar las veces que se repite esa palabra a lo largo del corpus.
Elecciones 10-N: lo que se puede contar
Vamos a analizar los programas electorales de los principales partidos que se presentan al 10-N desde un punto de vista separado de cualquier sesgo político.
Deja de decir palabras sin significado
Hay palabras que aportan poco al significado de una frase o un documento y que por contra pueden introducir ruido en el análisis de un corpus. Es habitual construir una lista con esas palabras y eliminarlas del corpus.
Acercamos los datos
Los datos están en todos los lugares y nosotros seleccionamos los que más se identifican con nuestro día a día
Aclaramos los conceptos
Hay muchos términos en inglés y los seguiremos usando, pero hablamos español y explicamos todo en nuestro idioma
Explicamos los métodos
Unas veces con más detalle, otras veces con menos, pero siempre con el objetivo de conocer mejor los algoritmos y métodos