Ciencia de datos para no científicos.


¿Qué es la Ciencia de Datos?

Empecemos con la situación más fácil para poder resolver este problema, buscando en Internet...



Y okey al parecer si apenas comenzamos en este tema , veremos una gran cantidad de información confusa, pero la ciencia de datos es realmente simple, lo podemos definir como un conjunto de metodologías para tomar miles de formas de datos que están disponibles para nosotros hoy 
y bueno , te preguntaras:

 ¿Para qué sirve tomar miles de datos ?



La respuesta también es simple, usamos todos esos datos para sacar conclusiones significativas, ya que bueno afortunadamente vivimos en un mundo rodeado de datos, todos los like de Facebook, cuando hacemos click a una página de internet, nuestro e-mail, cuando pagamos con nuestra tarjeta de crédito o el tweet que es un nuevo dato que se puede utilizar para describir mejor el presente o predecir mejor el futuro.

Entonces ya sabemos el concepto de Ciencia de Datos, ya sabemos para que sirve tomar todos los datos disponible y bueno ahora nos preguntamos:

¿Qué pueden hacer los datos para nosotros y para nuestro lugar de trabajo?


Aquí incluyo algunas funciones que pueden hacer los datos:

  •  Los datos pueden describir nuestro estado actual, esto se puede lograr con paneles o alertas, simplificando el proceso de informes que requieren mucho tiempo con la nueva tecnología de datos.

  • Podemos ayudar a detectar eventos anómalos, si nosotros tenemos datos sobre lo que sucedió en el pasado, podemos aumentar la eficiencia al detectar automáticamente un nuevo evento inesperado.

  •  Los datos también pueden diagnosticar las causas de los eventos y comportamientos observados.En lugar de determinar correlaciones entre un pequeño número de eventos , las técnicas científicas nos ayudan a comprender sistemas complejos con muchas causas posibles.

  •  Los datos pueden predecir eventos futuros , utilizando nuevas técnicas para tener en cuenta diversas causas y predecir posibles resultados.
Este ultimo punto es interesante, ya que podemos evaluar matemáticamente la probabilidad de nuestra predicción para aclarar nuestro nivel de incertidumbre.



Así que ahora que sabemos todo lo anterior , la siguiente pregunta es

 ¿Por qué es tan popular la  ciencia de datos?


La respuesta es bastante trivial,  estamos recopilando más datos que nunca y ahora supongamos que visitamos una agencia de automóviles y completamos algún cuestionario con información sobre nosotros y nuestras preferencias al momento de comprar un automóvil.

Todos esos datos se ingresan automáticamente en una computadora y combinado con los cientos de datos de agencias de automóviles se almacenan en una gran base de datos, una vez que tenemos estos datos, es fácil usar la dirección de correo electrónico que proporcionamos cuando completamos ese formulario, donde vinculamos los datos de compra de nuestro automóvil con nuestras redes sociales o con la información web.

De repente ¡ya tenemos una imagen muy completa de todas las personas que compraron un automóvil en el ultimo año!

  • Edades.
  • Gustos. 
  • Las cosas que no les gustan.
  • Sus amigos.
  • Sus familiares.
Estos datos adicionales , se pueden usar para predecir qué precio puede pagar una persona por su automóvil, que otras compras puede hacer , o la mejor manera de venderle un seguro para ese auto nuevo.

¿Cómo comenzamos a usar nuestros datos?

En ciencia de datos, generalmente tenemos tres pasos para cualquier proyecto:

  1. Recopilar datos de muchas fuentes: Cómo encuestas de clientes, tráfico web , correos electrónicos , redes sociales, clientes potenciales , transacciones financieras entre otros.
  2. Explorar y visualizar nuestros datos: Esto podría implicar la creación de presentaciones para rastrear cómo nuestros datos cambian con el tiempo o también podríamos realizar comparaciones entre dos conjuntos de datos.
  3. Predecir con los datos:Esto podría implicar la construcción de un sistema que segmenta a los clientes o clasifica imágenes de diferentes tipos de automóviles.

Ahora ya sabes cosas nuevas, como por qué la ciencia de datos es tan importante para los negocios y los primeros tres pasos en el flujo de trabajo de la Ciencia de Datos felicidades.

Comentarios

  1. hola como vas ! que me recomiendas para iniciarme en el mundo del data science

    ResponderBorrar
    Respuestas
    1. Buen día ! Saludos desde México , te recomiendo primero definir para que quieres dedicarte a la ciencia de datos, ya que es un disciplina que demanda mucha dedicación, una vez que hayas respondido esa pregunta, te recomiendo que estudies cursos de Estadística y Probabilidad , si no sabes nada de esto te recomiendo empezar con temas mas sencillos como el calculo y el algebra lineal.

      Te dejo aquí algunos cursos en caso de que estes interesado y también te dejo mi repositorio Github para que veas algunos temas básicos para empezar:

      REPOSITORIO:

      Aquí esta el repo para aprender Python:

      https://github.com/Chilangdon20/PYTHON

      Aquí esta el de R:


      https://github.com/Chilangdon20/Lenguaje-R

      CUROS:

      PROBABILIDAD - https://www.udemy.com/course/probabilidad-y-variables-aleatorias-para-ml-con-r-y-python/

      Algebra Lineal :

      https://www.udemy.com/course/algebralineal/

      Algunos de Coursera que son muy buenos también:

      https://www.coursera.org/specializations/mathematics-for-data-science

      Borrar
  2. Hola que tal, genial me gusta el contenido de tu blog y tus repositorios son de mucha ayuda, tengo una pregunta ya se algo del tema pero no sé mucho como usar las gráficas, la información de los datos y eso, me podrías recomendar algún libro donde pueda aprender más a dónde sobre data science y sus aplicaciones por favor

    ResponderBorrar

Publicar un comentario

Entradas populares