Saltar al contenido

Text Analytics

Las técnicas de Text Analytics ayudan a extraer información relevante proveniente de datos no estructurados o textos. En texto libre, las personas pueden expresarse y nos dicen qué es lo que realmente les importa y por qué, sin estar limitados por preguntas cerradas que decidimos hacerles. Todas las organizaciones necesitan entender a sus consumidores y a sus empleados, por lo que las fuentes de datos basadas en texto son un factor clave para que cualquier organización pueda comprender los “porqués” y actuar sobre ellos para mejorar las cosas.

Extracción de datos de textos libres

¿Dónde se aplica la Analítica de textos?

La información cualitativa y su análisis nos ayuda a complementar la información cuantitativa disponible sobre aspectos tales como la satisfacción de los empleados o su nivel de compromiso con la organización.

Analizando encuestas de empleados o entrevistas de salida, se obtiene mayor conocimiento sobre aspectos clave de la experiencia del empleado. Dicha información cualitativa podremos asociarla a otros datos que nos permita un análisis comparativo y cuantitativo para saber exactamente qué áreas necesitan mejoras.

También nos podemos encontrar texto libre en comentarios efectuados por los empleados en foros, blogs, o redes sociales.

Preguntas cerradas vs preguntas abiertas

En las encuestas nos podemos encontrar tanto preguntas cerradas como preguntas abiertas. Una pregunta cerrada está compuesta por opciones de respuesta establecidas previamente, entre las cuales el encuestado debe elegir; en una pregunta abierta el encuestado da su opinión utilizando sus propias palabras.

Las preguntas cerradas están diseñadas para crear datos fácilmente cuantificables. Además, son fáciles de codificar y permite a los investigadores categorizar a los encuestados en grupos según las opciones que hayan seleccionado. La desventaja principal de las preguntas cerradas es que, antes de crear la encuesta, el investigador ya debe conocer claramente el tema sobre el cual formula sus preguntas y cómo estas se relacionan con la hipótesis general de la investigación. Sin esta información, las preguntas cerradas ofrecen opciones insuficientes a los encuestados, preguntas que no reflejan adecuadamente el propósito de la investigación e información limitada o errónea. En la práctica, imaginemos que planteamos una pregunta sobre un aspecto determinado y ofrecemos una serie de opciones sobre las que los encuestados tienen que elegir: puede ser que ninguna de las opciones planteadas responda a la situación particular del encuestado o sea excesivamente simplista.

Aquí es donde entran las preguntas abiertas, que nos permite conocer todos los diferentes tipos de respuesta en lugar forzar al encuestado a tomar una decisión a partir de una lista con varias opciones. El problema que presentan este tipo de preguntas abiertas es a la hora de procesarlas y si se hace de forma exclusivamente manual, consume una gran cantidad de recursos. Típicamente encontramos estos textos en encuestas como el NPS, las encuestas de salida o en las evaluaciones de desempeño.

Para el NPS, por ejemplo, encontraremos esta pregunta cerrada:

¿Hasta qué punto recomendarías esta empresa como lugar para trabajar?

Siendo 0, NO SEGURO y 10, SIN DUDA.

Las preguntas abiertas de la encuesta dan a los participantes la libertad de responder y comentar cualquier cosa que vaya a la mente relacionada con la pregunta. Imaginemos que, a continuación de esta pregunta, planteamos la siguiente pregunta abierta:

¿Cuál es la principal razón de dar esa valoración?

Aunque es evidente que la explicación por parte del encuestado de la razón de su satisfacción o descontento con la empresa es crucial a la hora de aportarnos insights, es evidente que, dependiendo del número de respuestas, el tratamiento de miles de preguntas abiertas puede resultar muy laborioso.

Por este motivo, muchas empresas se limitan únicamente a analizar una pequeña muestra del total de las respuestas (a veces del 1%) lo que resulta claramente insuficiente.

Para superar este desafío, las tecnologías de análisis de texto procesan y analizan automáticamente el contenido textual y proporcionan información valiosa, transformando estos datos “crudos” en información estructurada y manejable. Aunque siempre es conveniente una revisión “humana” de los resultados obtenidos, el tiempo total se reduce de forma sustancial.

  1. Análisis de sentimiento

Esta técnica ayuda a identificar el sentimiento subyacente o nivel de polaridad (trabajamos con cinco niveles, desde muy negativo, a muy positivo) de las respuestas de texto. En el siguiente ejemplo, podemos ver cómo se aplica a una pregunta abierta (cómo describiría la cultura de su empresa).

Qué técnicas utilizamos para realizar Sentiment Analysis

Nos basamos en el análisis lingüístico (morfológico, sintáctico y semántico) del texto a analizar, más un componente basado en reglas. Las reglas contienen una palabra o expresión que indica la polaridad, el concepto, acción o entidad a la que califica y su contexto. Finalmente, usamos técnicas de ML en segundo plano.

2. Detección/categorización de temas

Esta técnica es la detección ó agrupación de temas similares que pueden ser relevantes para la organización.

De esta manera, podemos ver automáticamente qué tópicos aparecen más a menudo en las comunicaciones de nuestros empleados organizados según determinados temas: qué preocupaciones o aspectos determinados se repiten con frecuencia, qué valoran más, qué valoran menos. Este análisis se puede realizar periódicamente para ver la evolución en nuestra organización de algún tópico determinado.