Obtención de los datos necesarios para el análisis

Retomando el proceso general de un análisis de datos, una vez que identificaste el problema y lo dividiste a detalle, el siguiente paso es definir el método de análisis a emplear y posteriormente los datos que necesitas para realizarlo. Debes basarte en la pregunta detallada que quieres responder para definir el método de análisis.

Por ejemplo, para responder a la pregunta ¿Cómo se comportaron mis ventas en el último año? Podrías emplear el método de comparación sobre una gráfica. Una vez definido, requieres una tabla que contenga las ventas por cada mes durante todo el año para construir la gráfica propuesta.

Los métodos de análisis más usados son la Comparación, Bayes, Regresión Lineal y Optimización.

Definición de variables de datos.

Los datos se presentan de diversas maneras, por ejemplo, una fecha, un país o una postura política, todos estos son datos. Para agrupar datos del mismo tipo se definen variables, se les llama así porque su valor cambia o varía según el caso. En una base de datos, una variable sería equivalente a un campo.

Para hacer un análisis preciso es crucial, hacer las preguntas detalladas y definir las variables de forma correcta. De hacerlo mal todo el análisis será erróneo, a pesar de que elijas y apliques el método correctamente. Una pregunta detallada por lo general te inducirá algunas de las variables que necesitas y el método del análisis que definas te confirmará si te hace falta o te sobran variables.

Para saber que datos específicos requieres, primero debes definir las variables que necesitas, existen dos tipos de variables que dependen de los datos que contienen, estas pueden ser cualitativas o cuantitativas.

Las variables cualitativas tienen valores definidos por una cualidad, no por una cantidad, por ejemplo: estado civil, modelo de auto, dirección, entre otros. Existen dos tipos: Ordinales y Nominales, estas últimas se reconocen cuando los datos no tienen valores mayores o menores que otros. Las variables cualitativas por lo general son texto, pero pueden ser números, como el Código Postal, números telefónicos o códigos de productos. Por otra parte, las variables cualitativas ordinales son datos que si tienen valores mayores o menores que otros, por ejemplo, la variable clase social puede ordenarse en Baja, Media y Alta.

El otro tipo de variables, las cuantitativas, tienen valores definidos por una cantidad numérica, y siempre pueden ser ordenadas de menor a mayor o viceversa.

Retomando el ejemplo de las ventas por año, para realizar el análisis necesitas dos variables cuantitativas: las ventas representadas por unidad y el tiempo representado en meses.

Fuentes de Datos.

Una vez que sabes cuáles son los datos que requieres debes de obtenerlos de distintas fuentes, las fuentes de datos más comunes son: Tablas dinámicas (Excel) y bases de datos relacionales (SQL). Por lo general, en estas obtendrás datos cuantitativos de forma agrupada, es decir, sumas o promedios, pero también pueden estar los datos brutos a los que les hará falta una agrupación.

Por otro lado, para datos cualitativos, las fuentes serán textos tanto digitales como impresos, por ejemplo, encuestas, artículos, correos, audios.

En ocasiones, los datos que requieres no estarán disponibles, por lo que tienes que modificar el método de análisis para satisfacer el problema.

Fuente:
Fundación Carlos Slim – Curso Analista de Datos.

No hay comentarios.:

Publicar un comentario

La recomendación del momento

Los Autogobiernos de los Micaeles

Existen siete grupos de Hijos Creadores autootorgadores y están así clasificados de acuerdo con el número de veces que se han otorgado a las...

Lo más popular de la semana