RODRIGO NERI LOZANO's profile

EDA PERFIL PARA DATA ANALYST Y BUSINESS INTELLIGENCE

INGENIERO MATEMATICO JOSE RODRIGO NERI LOZANO 
EXPLORATORY DATA ANALYSIS (EDA) PARA DETERMINAR  ¿ COMO ES EL PERFIL DE UN ASPIRANTE AL PUESTO DE "DATA ANALYST" O "BUSINESS INTELLIGENCE" ?
                                                        SOBRE EL PROYECTO 

La recopilacion de los datos la realice extrayendo la informacion mas relevante y que mas presente se hacia entre las diferentes vacates de empleo publicadas en las plataformas "Linkedin", "Occ mundial", e "Indeed". Los datos los recopile durante un periodo de un mes, comprendido del dia 4 de marzo al 8 de abril. 

Esta publicacion representa una primer etapa del analisis en el cual se realizara un EDA de los datos para dar un primer "robusto" perfil del aspirante preparando el data set para un posterior proyecto de forcasting y en meses siguientes una actualizacion de ambos proyectos con los datos recopilados de 6 o 12 meses.

La linea de estudio del presente proyecto se centrara en contestar a la pregunta:
¿ COMO ES EL PERFIL DE UN ASPIRANTE AL PUESTO DE "DATA ANALYST" O "BUSINESS INTELLIGENCE" ?.​​​​​​​
                                                          SOBRE EL DATA SET 

Las variables que fueron extraidas de las vacantes laborales son las siguinetes:

SOBRE EL EMPLEADOR:
1.- EMPRESA: Empresa que publica el empleo 
2.- CARGO POSTULADO: Cargo postulado 

SOBRE LA PUBLICACION:
3.- PORTAL: Plataforma en la que se publico el empleo
4.- AREA: Categorizacion del empleo "Data analyst"(DS) o "Business intelligence"(BI)
5.- DIA: Dia en el que se realizo la publicacion 
6.- MES: Mes en el que se realizo la publicacion

SOBRE EL TRABAJO:
7.- MODALIDAD: Si el empleo es "Presencial", "Hibrido" o "Remoto"
8.- UBICACIÓN: Localidad para laborar
9.- SALARIO: Salario ofertado para el puesto

SOBRE LAS CAPACIDADES COMPUTACIONALES:
10.- EXCEL: Se solicita explicitamete su conocimiento "si" o "unknown" si no se especifica
11.- POWER BI: Se solicita explicitamete su conocimiento "si" o "unknown" si no se especifica
12.- PYTHON: Se solicita explicitamete su conocimiento "si" o "unknown" si no se especifica
13.- SQL: Se solicita explicitamete su conocimiento "si" o "unknown" si no se especifica
14.- TABLEAU: Se solicita explicitamete su conocimiento "si" o "unknown" si no se especifica

SOBRE "HABILIDADES BLANDAS":
15.- INGLES: Se solicita explicitamete su conocimiento "a" basico, "b" intermedio, "c" avanzado o "unknown" si no se especifica
16.- EXPERIENCIA: Experiencia solicitada en años 
17.- ANALISIS: Se solicita explicitamete tener capacidad analitica "si" o "unknown" si no se especifica
18.- CIENCIA DE DATOS: Se solicita explicitamete tener capacidad de diencia de datos "si" o "unknown" si no se especifica
19.- TITULADO: Se solicita explicitamete estar titulado "si", "no" o "unknown" si no se especifica
                                                  Demos comienzo al EDA...
PRESENTACION DEL DATA SET:
Tamaño y estructura general de los datos, como el tipo de variable y cantidad de valores nulos
Estructuracion:
                               

                                    ANALISIS DE LAS VARIABLES CATEGORICAS
Para las variables que nos hablan sobre el empleador ( "Empresa" y "Cargo postulado" ) ambas variables no seran consideradas para el siguiente proyecto ya que no resultan relevantes para determinar el perfil del aspirante, sin embargo se presentara un breve conteo de las variables para dar a conocer un poco sobre la informacion recabada. 
De las empresas mas presentes tenemos:  "confidencial",  "PEPSICO" , "FISIFO SA DE CV SOFOM ER", "ADECO", entre otras, con un total de 120 categorias o "empresas" diferentes.

Para los cargos postulados notemos que todos se encuentran dentro de las categorias de data analyst y business intelligence con pequeñas variaciones como "INGLES AVANZADO", "PYTHON" O "SR"  entre algunos más con un total de 91 cargos diferentes.
SOBRE LA PUBLICACION:
PORTAL: Podemos observar que la moyer cantidad de vacantes regitraas fueron ublicadas en occ mundial, en segundo lugar en linkedin y finalmente la menor cantidad de ellas fueron sacadas de indeed.

MES: Como era de esperarse la mayor cantidad de registros que se tienen pertenencen al mes de marzo ya que es en este mes en donde se concentraron los esfuerzos de registro.
( Estas dos variables no seran consideradas para la siguiente etapa ya que no se presentan ser significativas para el estudio que se desea realizar)

ÁREA: Tenemos una mayor catidad de registros para empleos que pertenecen al areas de data analyst (ds) que para los empleos de business intelligence (bi).
( Esta variable se conservara ya que nos categoriza los empleos y con ello podremos realizar el contraste entre las dos diferentes áreas.) 
SOBRE EL EMPLEO:
UBICACION: Todos los empleos que se analizaran se encuentran en la cdmx, teniendo ese dato presente la variable no se considerara para la siguiente etapa, solo se tendra en cuenta que el marco de estudio se delimita a esta zzona geografica.

MODALIDAD: Esta variable nos resulta conveniente conservarla ya que nos da informacion relevante sobre las preferencias de los empleadores y por consiguiente sobre el perfil que debera de tomar el aspirante.
SOBRE LAS CAPACIDADES COMPUTACIONALES:
En estas variables encontraremos informacion valiosa de caracter inpresindible para dar forma al perfil del postulante ya que nos proporciona informacion directa sobre las capacidades minimas que se espera del postulante.
Observemos que "excel", "sql" y "power bi" son habilidades que gustan mas a los empleadores para ambas ramas (bi) y (ds)
SOBRE "HABILIDADES BLANDAS":
De esta seccion nos encontramos que a la gran parte de los empleadores no les es de gran importancia que el postulante especifique si esta titulato o no, de aqui pueden salir dos caminos; que se espere que se cuente con el titulo y por ello no lo especifiquen o bien que con presentar algun papel que de fe al conocimiento adquirido (carta pasante) o baste con pasar los examenes de admision que realice la empresa.

Para "ciencia de datos" y "analisis" estamos habalando de capacidades que implicitamente se requieren para ocupar el puesto que se esta ofertando por lo que resulta normal encontrar que en su mayoria las ofertas laborales no lo especifiquen dentro de las caracteristicas laborales.

En la variable "ingles" encontramos significacncia para el perfil y sera la unica de esta seccion que se conserve. Notemos que la mayor parte de las publicaciones indican a un perfil que se coloque en un conocimiento intermedio del idioma.
                             

                                  ANALISIS DE LAS VARIABLES NUMERICAS:
Esta variable no responde directamente a alguna caracteristica del perfil, mas bien responde a la frecuencia con la que las empresas realizan publicaciones de vacantes laborales, las cuales debido a las fechas en las que fueron recabados los datos nos daran mayor peso a los primeros y ultimos dias del mes lo que se confirma al ver la distribucion de los datos.
Para la variable experiencia encontramos una variabilidad para ambos puestos la cual va desde 1 año hasta los 5 años (encontrando este ultimo valor como un outlier  y 1 año outlier para "bi"), mientras que para los puestos de "bi" tenemos una estacionariedad dentro del rango [1-2] años. Por lo que podemos concluir que para ambos puestos  en promedio se requiere de una experiencia de 2 años. 
Encuenato a salario encontramos que la media se encuentra en 22,166 pesos en general y particularmente para "bi" una media de 18,511 pesos mientras que para "ds" la media se encuentra en 24,061 teniendo que para estos datos en promedio un "ds" gana más que un "bi".
Por ultimo para finalizar el analisis univariado, realizamos una correlacion entre las variables para cada grupo de trabajos en el que podremos ver como es que se relaciona cada variable entre si:
PUESTOS PARA BI
PUESTOS PARA DS
                                                          

                                                         CONCLUSIONES:
Los aspirantes deberan:
-Buscar empleo preferentemente en OCC o Linkedin
-Tener disponibilidad de mobilidad a las oficinas del contratista
-Preferentemente tener conocimientos de:
   Excel
   Power BI
   Sql
   Python
   Ingles intermedio
-En algunos casos se tendra ventaja sobre los otros postulantes si se cuenta con titulo 

-Particularmente para "bi":
    Preferentemente experiencia de 2 años 
    mayor correlacion entre experiencia (69%) , python(26%) y el salario

-Particularmente para "ds":
    Preferentemente experiencia mayor a los 2 años 
    mayor correlacion entre experiencia (61%) , sql (42%) y el salario


En la siguiente entrega se realizara el pronostico (forcasting) explicando el salario con las variables presentadas aqui haciendo uso de los modelos de regresion lineal.
Continuacion del proyecto . . .

 https://www.behance.net/gallery/195900155/FORCAST-PERFIL-DE-ASPIRANTE-DE-DATA-ANALYST-Y-BI
EDA PERFIL PARA DATA ANALYST Y BUSINESS INTELLIGENCE
Published:

Owner

EDA PERFIL PARA DATA ANALYST Y BUSINESS INTELLIGENCE

Published: