Los datos como punto de partida
Sea lo que sea que estemos investigando o tratando de responder, necesitamos dos cosas: datos y una explicación de esos datos. En este sentido, la estadística como técnica cuantitativa puede sernos de enorme ayuda ya que nos ayuda a tratar esos datos de forma científica y el análisis de datos puede servir para idear nuevas soluciones a problemas conocidos. Los datos pueden referirse a casi cualquier área de conocimiento: científica, empresarial, referida a la conducta humana, etc.
Si nos centramos en el área de la empresa y, concretamente, en todo lo relacionado con sus empleados, podemos (y debemos) plantearnos muchas preguntas referidas a su comportamiento. A fin de cuentas, una empresa es un conjunto de personas que trabajan con un fin común.
People Analytics y Text Analytics
La respuesta, desde un punto de vista cuantitativo, a cualquier pregunta que tenga en mente relacionada con sus empleados (referidas a su contratación, rendimiento, rotación, …) es, por tanto simple: para responderla necesita datos. Por supuesto, hay formas de datos además de los números que se pueden usar para probar y generar teorías. Cuando se trata de números la investigación involucra métodos cuantitativos que podemos denominar como People Analytics o HR Analytics, pero también puede generar y probar teorías mediante el análisis del lenguaje (como reseñas en redes sociales, artículos de revistas o respuestas abiertas en encuestas) que involucran otro tipo de técnicas denominadas Text Analytics.
¿Cómo podemos, entonces, responder a una pregunta relevante para nuestra empresa? El método de investigación como punto de partida nos ayuda como vemos a continuación.
El proceso de investigación

Como vemos en la figura, el proceso de investigación comienza con una observación incial que se desea comprender y esta observación podría ser anecdótica (por ejemplo, en un hospital determinado parece que las enfermeras abandonan antes el hospital con mayor frecuencia que el resto de los empleados) o podría basarse en algunos datos (la tasa de rotación de las enfermeras durante el primer año es del 25%).
A partir de su observación inicial, genera explicaciones o teorías de esas observaciones, a partir de las cuales puede hacer predicciones (hipótesis). Aquí es donde entran los datos en el proceso porque para probar sus predicciones necesita datos. Primero recopila algunos datos relevantes y luego analiza esos datos. El análisis de los datos puede respaldar su teoría o darle motivos para modificar las teorías. Como tal, los procesos de recopilación y análisis de datos y la generación de teorías están intrínsecamente vinculados.
Respondiendo a problemas: ejemplo práctico
El departamento de RRHH de un hospital estaba preocupado: la tasa de rotación de las enfermeras durante el primer año era del 25%; esto significaba que 1 de cada 4 enfermeras abandonaba la empresa en el primer año en el que fueron empleados por la empresa. La tasa promedio de abandono de la empresa era del 10% o, lo que es lo mismo, 1 de cada 10 personas en general dejaría la empresa en un año determinado. La diferencia entre ambas cifras era considerable.
Como es lógico, el departamento de RRHH quería reducir a toda costa la cifra de abandono de las enfermeras por el impacto negativo que tenía a todos los niveles de la organización (costes de selección, tiempo de incorporación, atención a los pacientes, etc.). El tiempo de capacitación, además, solía ser elevado pues tenían como política incorporar a enfermeras recién salidas de la escuela o con muy poca experiencia profesional como forma de controlar los costes.
Análisis de los datos: buscando posibles explicaciones o patrones
Para solucionar este problema, un analista del departamento realizó un análisis de los datos y observó que había una diferencia considerable si se tenía en cuenta el número de años de experiencia de las enfermeras que abandonaban el hospital y las que permanecían. De hecho, las enfermeras con menor experiencia tenían una tasa de rotación mucho más elevada durante el primer año frente a las más experimentadas. Aunque parezca obvio, hasta que no se analizaron los datos, no se había identificado esta diferencia. La teoría, por tanto, no era «las enfermeras abandonan la empresa durante el primer año con una tasa del 25%» sino «las enfermeras con poca o ninguna experiencia abandonan la empresa durante el primer año a una tasa significativamente mayor que las enfermeras más experimentadas».
La identificación del problema es esencial para diseñar la solución adecuada
Es evidente que a las contrataciones más experimentadas se les debe pagar más pero también que tienen más probabilidades de tener éxito y de permanecer en el hospital más allá del primer año. Al centrarse en contratar a los candidatos con las características que predicen la permanencia en la empresa, los datos mostraron que el hospital podría reducir la tasa de rotación al 15%. Esta reducción de la tasa de rotación compensaría con creces el coste de la contratación de enfermeras con más experiencia. Con el paso del tiempo, la tasa de abandono de las enfermeras disminuyó, los costes se redujeron y las medidas de seguridad a los pacientes aumentaron.

Este es un ejemplo sencillo pero clarificador que nos muestra cómo el análisis de datos puede servir para idear nuevas soluciones a problemas conocidos. Al aportarnos nuevas perspectivas e insights, podemos diseñar estrategias que aborden el problema de raíz, sin limitarnos a quedarnos con lo obvio.