Construyendo un equipo

Construyendo un equipo de Ciencia de Datos.

Es posible , que te sorprenda al saber que Ciencia de Datos no es un campo único, en realidad hay tres campos :

  • Ingeniero de datos.
  • Analista de datos.
  • Científico de Machine Learning.
Exploremos cada uno de ellos:

Ingeniero de Datos:

Los ingenieros de datos controlan en flujo de información, crean datos especializados , sistemas de almacenamiento y la infraestructura para garantizar que los datos sean fáciles de obtener y procesar.

La mayoría de los ingenieros de datos están muy familiarizados con SQL, que utilizan para almacenar y administrar grandes datos, también usan uno de los siguientes lenguajes de programación como Java, Scala o Python para poder procesar datos y automatizar tareas relacionadas con datos.

Analista de Datos:

Ellos describen el presente através de los datos, lo hacen con dashboards, pruebas de hipótesis y visualización. A menudo tienen algunos antecedentes en estadística o computación, pero tienden a tener menos experiencia en ingeniería que los ingenieros de datos y menos experiencia en matemáticas que los científicos de datos.


Los analistas de datos usan hojas de cálculo para realizar análisis simples en pequeñas cantidades de datos, usan SQL , el mismo lenguaje utilizado por los ingenieros de datos, para análisis más grandes.

Mientras los ingenieros de datos crean y configuran soluciones de almacenamiento SQL, los analistas de datos utilizan bases existentes para consumir y resumir datos.

Los analistas también usan Business Intelligence o BI , heramientas como Tableau,Power BI , Looker entre otras para crear dashboards y compartir sus análisis.

Cientifico Machine Learning:


Esta es quizá la parte más animada de la Ciencia de Datos, se solía extrapolar lo que probablemente sea cierto de lo que ya sabemos, estos científicos usan los datos de entrenamiento para clasificar datos más grandes y poco rigurosos, por ejemplo nos puede decir cuánto dinero podría valer una acción la próxima semana,que imágenes contiene un atuomóvil o qué sentimientos se expresan en un conjunto de Tweets.

Los científicos de Machine Learning usan Python o R para crear sus modelos predictivos,ambos son lenguajes de programación excelentes para la ciencia de datos y una persona que sabe leer código en Python puede leer código en R y al revés.


Recordemos que los lenguajes de programación no son tan difíciles de aprender como los idiomas hablados, si alguien sabe hablar español , podría tomar años aprender chino por ejemplo mientras que los lenguajes de programación son mas similares a las herramientas eléctricas, si sabemos cómo usar un talado , no necesariamente sabemos cómo usar un corta arboles , pero probablemente con un poco de entrenamiento podamos aprender.

Una vez que ya tengamos nuestro equipo de profesionales de datos , hay tres principales formas en que podemos estructurar nuestro equipo de datos:

  • Aislado
  • Incrustado
  • Híbrido
Un equipo de datos aislado puede contener uno o varios típos de empleados de datos , sin ningun otro equipo como la ingeniería o el diseño de producto.Esta es una gran estructura para capacitar a los nuevos miembros del equipo y cambiar rápidamente en qué proyecto está trabajando cada miembro.


Alternativamente, puede ser útil usar un modelo incrustado donde cada empleado es parte de un escruadrón , que también contiene ingenieros y gerentes de producto.Este modelo permite que cada empleado de datos gane experiencia en un proyecto empresarial específico, lo que los convierte en un experto.

El modelo híbrido se parece al modelo integrado,pero con una sincronización adicional para todos los empleados de datos en todos los escuadrones.Esta capa adicional de organización permite procesos de datos uniformes y desarrollo profesional , independientemente del proyecto al que esté asignado un empleado.

Comentarios

Entradas populares