Aplicando la Ciencia de Datos

Aplicaciones de la Ciencia de Datos.

Introducción:


Ahora que ya sabemos que es la ciencia de datos y los pasos en un flujo de trabajo de ciencia de datos, aprenderemos como aplicar la ciencia de datos en problemas de negocios reales.Profundizaremos en treas áreas interesantes de Ciencia de Datos:

  • Machine Learning Tradicional.
  • IoT - Internet de las Cosas.
  • Deep Learning

PRIMER CASO: Detección de Fraude.


Supongamos que nuestra compañía  es contratada para detectar fraudes de un Banco grande y nos gustaría usar datos para determinar la probabilidad de que la transacción sea falsa.

Para responder a esta pregunta, podemos comenzar reuniendo información sobre cada compra, como el monto, la fecha , la ubicación , el tipo de compra y la dirección del dueño de la tarjeta.Tengamos en cuenta que necesitaremos mucha información de transacciones, incluida la que mencionamos anteriormente así como una etiqueta que nos indica si cada transacción es válida o fraudulenta.

En un caso milagroso , probablemente tengamos esta información en una base de datos y todos los registros que tiene la base de datos se denominan datos de entrenamiento y los usaremos para construir un algoritmo.

La función de este algoritmo sera que cada vez que se produce una nueva transacción , proporcionaremos  información a nuestro algoritmo , como la cantidad y la fecha y responderemos a la pregunta original 

¿Cuál es la probabilidad de que esta transacción sea fraudulenta?

 

Antes de responder a esa pregunta, veamos nuestro ejemplo y resaltemos lo que necesitamos para que el Machine Learning funcione y haga su magia:

  • Primero: Un problema de ciencia de datos comienza con una pregunta bien definida , nuestra pregunta fue ¿Cuál es la probabilidad de que esta transacción sea fraudulenta?
  • Segundo: Necesitamos algunos datos para analizar, en este caso supongamos que tuvimos antiguas transacciones con tarjeta de crédito y asociadas a metadatos que ya habían sido identificados como fraudulentos o válidos.
  • Tercero:Necesitamos datos adicionales, cada vez que queremos hacer una nueva predicción y también necesitamos tener el mismo tipo de información sobre cada nueva compra, para que podamos etiquetarlo como fraudulento o valido.


SEGUNDO CASO: Smart Watch.


Supongamos que estamos tratando de construir un smart watch para poder monitorear la actividad física, nuestro objetivo es poder detectar automáticamente diferentes actividades, como caminar o correr.Nuestro SmartWatch está equipado con un sensor especial, llamado acelerómetro, que monitorea el movimiento en tres dimensiones.

Los datos generados por este sensor son la base de nuestro problema de Machine Learning, podemos hacer un estudio y pedirle a varias personas que usen nuestro reloj y graben cuando están corriendo o caminando, entonces podríamos desarrollar un algoritmo que reconozca los datos del acelerómetro que representan uno de estos estados: caminar o correr.


Nuestro SmartWatch es parte de un campo de rápido crecimiento llamado Internet de las Cosas (IoT) y se combina con la Ciencia De Datos.

IoT - se refiere a dispositivos que no son computadoras estándar , pero que aún tienen la capacidad de transmitir datos , esto incluye relojes inteligentes, sistemas de seguridad para el hogar conectados a internet, sistemas electrónicos de cobro de peajes , sistemas de gestión energética de edificios y muchooooo mas.

Los datos de IoT , son un gran recurso para proyecto de ciencia de datos, veamos otro ejemplo:

TERCER CASO: Reconocimiento de imágenes.



Una tarea clave para los autos sin conductor es identificar cuándo una imagen contiene un humano...¿Cuál sera el conjunto de dato para este problema?

Podríamos expresar la imagen como una matriz de números donde cada número representa un pixel.Sin embargo , este enfoque probablemente fracasaría si introdujiéramos la matriz en un modelo tradicional de Machine Learning.Probablemente tendríamos demasiados datos! y necesitamos un algoritmo mucho más avanzado, conocido como Deep Learning.


En Deep Learning, existen múltiples capas de mini algoritmos , llamadas 'neuronas', que trabajan juntas para sacar conclusiones complejas, Deep Learning toma mucha mas información de entrenamiento que Machine Learning, pero también es capaz de aprender relaciones que los modelos tradicionales no pueden.

También se utiliza para resolver problemas de uso intensivo de datos , como la clasificación de imágenes o la comprensión del lenguaje, mas adelante escribiré otro articulo hablando de Machine Learning & Deep Learning.

Comentarios

Entradas populares