viernes, 3 de noviembre de 2023

Introducción al análisis de datos



Introducción

Fuente: Microsoft

Como analista de datos, está en un viaje. Piensa en todos los datos que se generan cada día y están disponibles en tu organización, desde datos transaccionales en bases de datos tradicionales, hasta datos de telemetría de los servicios que utilizas, pasando por las señales que recibes de diferentes áreas como las redes sociales.

Por ejemplo, las empresas de ventas de hoy en día recopilan y almacenan cantidades masivas de datos que rastrean los artículos que se buscaron y se compraron, las páginas que visitaron en su sitio, los pasillos en los que compra productos, los hábitos de gasto de los clientes y mucho más.

Con los datos y la información como el activo más estratégico de un negocio, el desafío subyacente que enfrentan las organizaciones hoy en día es comprender y utilizar sus datos para afectar positivamente el cambio dentro del negocio. Las empresas continúan luchando por usar sus datos de manera significativa y productiva, lo que afecta su capacidad de actuar.

Una empresa que vende un producto o servicio debe poder usar sus grandes cantidades de datos e información de tal manera que impacte en el negocio, incluyendo:

·        seguimiento de inventario

·        Identificar hábitos de compra.

·        Detección de tendencias y patrones de usuarios.

·        Recomendar compras

·        Determinación de optimizaciones de precios

·        Identificar y detener el fraude

Además, es posible que esté buscando patrones de venta diarios/mensuales. Los segmentos de datos comunes que quizás desee examinar incluyen día tras día, semana tras semana y mes tras mes para que pueda comparar cómo han sido las ventas con respecto a dónde estaban en la misma semana del año pasado, por ejemplo.

La clave para desbloquear estos datos es poder contar una historia con ellos. En el mundo empresarial altamente competitivo y vertiginoso de hoy en día, la elaboración de informes que cuenten esa historia es lo que ayuda a los líderes empresariales a tomar medidas sobre los datos. Los tomadores de decisiones comerciales dependen de una historia precisa para impulsar mejores decisiones comerciales. Cuanto más rápido una empresa pueda tomar decisiones precisas, más competitivas serán y mejores ventajas tendrán. Sin la historia, es difícil entender lo que los datos intentan decirte.

Sin embargo, tener datos por sí solo no es suficiente. Debe poder actuar sobre los datos para afectar el cambio dentro del negocio. Esa acción podría implicar la reasignación de recursos dentro del negocio para satisfacer una necesidad, o podría ser identificar una campaña fallida y saber cuándo cambiar de rumbo. En estas situaciones es importante contar una historia con sus datos.

El desafío subyacente al que se enfrentan las empresas hoy en día es comprender y utilizar sus datos de tal manera que impacte en su negocio y, en última instancia, en sus resultados. Debe poder ver los datos y facilitar decisiones comerciales confiables. Luego, necesita la capacidad de mirar las métricas y comprender claramente el significado detrás de esas métricas.

Este requisito puede parecer desalentador, pero es una tarea que puede realizar. Su primer paso es asociarse con expertos en datos dentro de su organización, como ingenieros de datos y científicos de datos, para ayudarlo a obtener los datos que necesita para contar esa historia. Pida a estos expertos que participen en ese viaje de datos con usted.

Su viaje de contar una historia con datos también se relaciona con la construcción de esa cultura de datos dentro de su organización. Si bien contar la historia es importante, el lugar donde se cuenta esa historia también es crucial, asegurando que la historia se cuente a las personas adecuadas. Además, asegúrese de que las personas puedan descubrir la historia, que sepan dónde encontrarla y que sea parte de las interacciones regulares.

El análisis de datos existe para ayudar a superar estos desafíos y puntos débiles y, en última instancia, ayudar a las empresas a encontrar información y descubrir el valor oculto en grandes cantidades de datos a través de la narración de historias. A medida que siga leyendo, aprenderá cómo usar y aplicar habilidades analíticas para ir más allá de un solo informe y ayudar a impactar e influir en su organización al contar historias con datos e impulsar esa cultura de datos.

Descripción general del análisis de datos

Antes de que los datos puedan usarse para contar una historia, deben pasar por un proceso que los haga utilizables en la historia. El análisis de datos es el proceso de identificar, limpiar, transformar y modelar datos para descubrir información significativa y útil. Luego, los datos se elaboran en una historia a través de informes para el análisis para respaldar el proceso crítico de toma de decisiones.

A medida que el mundo se vuelve más impulsado por los datos, la narración a través del análisis de datos se está convirtiendo en un componente y aspecto vital de las empresas grandes y pequeñas. Es la razón por la que las organizaciones continúan contratando analistas de datos.

Las empresas basadas en datos toman decisiones basadas en la historia que cuentan sus datos, y en el mundo actual basado en datos, los datos no se utilizan en todo su potencial, un desafío al que se enfrentan la mayoría de las empresas. El análisis de datos es, y debería ser, un aspecto crítico de todas las organizaciones para ayudar a determinar el impacto en su negocio, incluida la evaluación de la opinión del cliente, la realización de estudios de mercado y de productos, y la identificación de tendencias u otras perspectivas de datos.

Si bien el proceso de análisis de datos se centra en las tareas de limpieza, modelado y visualización de datos, no se debe subestimar el concepto de análisis de datos y su importancia para el negocio. Para analizar los datos, los componentes centrales de la analítica se dividen en las siguientes categorías:  

  • Descriptivo
  • Diagnóstico
  • Profético
  • Preceptivo
  • Cognitivo

Analítica descriptiva

El análisis descriptivo ayuda a responder preguntas sobre lo que sucedió en función de los datos históricos. Las técnicas de análisis descriptivo resumen grandes conjuntos de datos para describir los resultados a las partes interesadas.

Al desarrollar indicadores clave de rendimiento (KPI), estas estrategias pueden ayudar a rastrear el éxito o el fracaso de los objetivos clave. Las métricas como el retorno de la inversión (ROI) se utilizan en muchas industrias y se desarrollan métricas especializadas para realizar un seguimiento del rendimiento en industrias específicas.

Un ejemplo de análisis descriptivo es generar informes para proporcionar una vista de los datos financieros y de ventas de una organización.

Análisis de diagnóstico

Los análisis de diagnóstico ayudan a responder preguntas sobre por qué sucedieron los eventos. Las técnicas de análisis de diagnóstico complementan el análisis descriptivo básico y utilizan los resultados del análisis descriptivo para descubrir la causa de estos eventos. Luego, los indicadores de desempeño se investigan más a fondo para descubrir por qué estos eventos mejoraron o empeoraron. Generalmente, este proceso ocurre en tres pasos:

·        Identificar anomalías en los datos. Estas anomalías pueden ser cambios inesperados en una métrica o en un mercado en particular.

·        Recopile datos relacionados con estas anomalías.

·        Utilice técnicas estadísticas para descubrir relaciones y tendencias que expliquen estas anomalías.

Analítica predictiva

El análisis predictivo ayuda a responder preguntas sobre lo que sucederá en el futuro. Las técnicas de análisis predictivo utilizan datos históricos para identificar tendencias y determinar si es probable que se repitan. Las herramientas analíticas predictivas brindan información valiosa sobre lo que podría suceder en el futuro. Las técnicas incluyen una variedad de técnicas estadísticas y de aprendizaje automático, como redes neuronales, árboles de decisión y regresión.

Analítica prescriptiva

El análisis prescriptivo ayuda a responder preguntas sobre qué acciones se deben tomar para lograr una meta o un objetivo. Mediante el uso de información de análisis predictivo, las organizaciones pueden tomar decisiones basadas en datos. Esta técnica permite a las empresas tomar decisiones informadas ante la incertidumbre. Las técnicas de análisis prescriptivo se basan en el aprendizaje automático como una de las estrategias para encontrar patrones en grandes conjuntos de datos. Al analizar decisiones y eventos pasados, las organizaciones pueden estimar la probabilidad de diferentes resultados.

Analítica cognitiva

El análisis cognitivo intenta extraer inferencias de datos y patrones existentes, derivar conclusiones basadas en bases de conocimiento existentes y luego agregar estos hallazgos nuevamente a la base de conocimiento para inferencias futuras, un ciclo de retroalimentación de autoaprendizaje. El análisis cognitivo lo ayuda a saber qué podría suceder si las circunstancias cambian y determinar cómo podría manejar estas situaciones.

Las inferencias no son consultas estructuradas basadas en una base de datos de reglas; más bien, son hipótesis no estructuradas que se recopilan de varias fuentes y se expresan con diversos grados de confianza. Los análisis cognitivos efectivos dependen de algoritmos de aprendizaje automático y utilizarán varios conceptos de procesamiento de lenguaje natural para dar sentido a las fuentes de datos no explotadas anteriormente, como los registros de conversación del centro de llamadas y las reseñas de productos.

Roles en los datos

Contar una historia con los datos es un viaje que normalmente no comienza contigo. Los datos deben venir de alguna parte. Obtener esos datos en un lugar que pueda utilizar requiere un esfuerzo que probablemente esté fuera de su alcance, especialmente en consideración de la empresa.

Las aplicaciones y los proyectos actuales pueden ser grandes e intrincados y, a menudo, implican el uso de habilidades y conocimientos de numerosas personas. Cada persona aporta un talento y experiencia únicos, compartiendo el esfuerzo de trabajar juntos y coordinar tareas y responsabilidades para ver un proyecto desde el concepto hasta la producción.

En el pasado reciente, roles como analistas comerciales y desarrolladores de inteligencia comercial eran el estándar para el procesamiento y la comprensión de datos. Sin embargo, la expansión excesiva del tamaño y los diferentes tipos de datos ha provocado que estos roles evolucionen hacia conjuntos de habilidades más especializados que modernizan y agilizan los procesos de ingeniería y análisis de datos.

Las siguientes secciones destacan estos diferentes roles en los datos y la responsabilidad específica en el espectro general de descubrimiento y comprensión de datos:

  • Analista de negocios
  • Analista de datos
  • Ingeniero de datos
  • Científico de datos
  • Administrador de base de datos

Analista de negocios



Si bien existen algunas similitudes entre un analista de datos y un analista de negocios, el diferenciador clave entre los dos roles es lo que hacen con los datos. Un analista de negocios está más cerca del negocio y es un especialista en interpretar los datos que provienen de la visualización. A menudo, los roles de analista de datos y analista de negocios pueden ser responsabilidad de una sola persona.

Analista de datos



Un analista de datos permite a las empresas maximizar el valor de sus activos de datos a través de herramientas de visualización e informes como Microsoft Power BI. Los analistas de datos son responsables de perfilar, limpiar y transformar los datos. Sus responsabilidades también incluyen el diseño y la creación de modelos de datos escalables y efectivos, y la habilitación e implementación de capacidades de análisis avanzado en informes para análisis. Un analista de datos trabaja con las partes interesadas pertinentes para identificar los datos apropiados y necesarios y los requisitos de informes, y luego se les asigna la tarea de convertir los datos sin procesar en información relevante y significativa.

Un analista de datos también es responsable de la administración de los activos de Power BI, incluidos los informes, los paneles, las áreas de trabajo y los conjuntos de datos subyacentes que se usan en los informes. Tienen la tarea de implementar y configurar los procedimientos de seguridad adecuados, junto con los requisitos de las partes interesadas, para garantizar la protección de todos los activos de Power BI y sus datos.

Los analistas de datos trabajan con ingenieros de datos para determinar y ubicar fuentes de datos adecuadas que cumplan con los requisitos de las partes interesadas. Además, los analistas de datos trabajan con el ingeniero de datos y el administrador de la base de datos para garantizar que el analista tenga acceso adecuado a las fuentes de datos necesarias. El analista de datos también trabaja con el ingeniero de datos para identificar nuevos procesos o mejorar los procesos existentes para recopilar datos para el análisis.

Ingeniero de datos



Los ingenieros de datos aprovisionan y configuran tecnologías de plataforma de datos que están en las instalaciones y en la nube. Gestionan y aseguran el flujo de datos estructurados y no estructurados de múltiples fuentes. Las plataformas de datos que utilizan pueden incluir bases de datos relacionales, bases de datos no relacionales, flujos de datos y almacenes de archivos. Los ingenieros de datos también se aseguran de que los servicios de datos se integren de forma segura y sin problemas en las plataformas de datos.

Las responsabilidades principales de los ingenieros de datos incluyen el uso de herramientas y servicios de datos locales y en la nube para ingerir, extraer y transformar datos de múltiples fuentes. Los ingenieros de datos colaboran con las partes interesadas del negocio para identificar y cumplir con los requisitos de datos. Diseñan e implementan soluciones.

Si bien puede existir cierta alineación en las tareas y responsabilidades de un ingeniero de datos y un administrador de base de datos, el alcance del trabajo de un ingeniero de datos va mucho más allá de cuidar una base de datos y el servidor donde está alojada y probablemente no incluye la administración general de datos operativos.

Un ingeniero de datos agrega un valor tremendo a los proyectos de inteligencia comercial y ciencia de datos. Cuando el ingeniero de datos reúne datos, lo que a menudo se describe como disputa de datos, los proyectos avanzan más rápido porque los científicos de datos pueden concentrarse en sus propias áreas de trabajo.

Como analista de datos, trabajaría en estrecha colaboración con un ingeniero de datos para asegurarse de que pueda acceder a la variedad de fuentes de datos estructurados y no estructurados, ya que lo ayudarán a optimizar los modelos de datos, que normalmente se sirven desde un almacén de datos o un lago de datos modernos. .

Tanto los administradores de bases de datos como los profesionales de inteligencia comercial pueden hacer la transición a un rol de ingeniero de datos; necesitan aprender las herramientas y la tecnología que se utilizan para procesar grandes cantidades de datos.

Científico de datos



Los científicos de datos realizan análisis avanzados para extraer valor de los datos. Su trabajo puede variar desde el análisis descriptivo hasta el análisis predictivo. El análisis descriptivo evalúa los datos a través de un proceso conocido como análisis exploratorio de datos (EDA). El análisis predictivo se utiliza en el aprendizaje automático para aplicar técnicas de modelado que pueden detectar anomalías o patrones. Estos análisis son partes importantes de los modelos de pronóstico.

Los análisis descriptivos y predictivos son solo aspectos parciales del trabajo de los científicos de datos. Algunos científicos de datos pueden trabajar en el ámbito del aprendizaje profundo, realizando experimentos iterativos para resolver un problema de datos complejo mediante el uso de algoritmos personalizados.

La evidencia anecdótica sugiere que la mayor parte del trabajo en un proyecto de ciencia de datos se gasta en disputas de datos e ingeniería de características. Los científicos de datos pueden acelerar el proceso de experimentación cuando los ingenieros de datos usan sus habilidades para manejar los datos con éxito.

En la superficie, podría parecer que un científico de datos y un analista de datos están muy separados en el trabajo que realizan, pero esta conjetura no es cierta. Un científico de datos analiza los datos para determinar las preguntas que necesitan respuestas y, a menudo, ideará una hipótesis o un experimento y luego recurrirá al analista de datos para que lo ayude con la visualización y el informe de datos.

Administrador de base de datos



Un administrador de base de datos implementa y administra los aspectos operativos de las soluciones de plataforma de datos híbridas y nativas de la nube que se basan en los servicios de datos de Microsoft Azure y Microsoft SQL Server. Un administrador de base de datos es responsable de la disponibilidad general y el rendimiento constante y las optimizaciones de las soluciones de base de datos. Trabajan con las partes interesadas para identificar e implementar las políticas, las herramientas y los procesos para los planes de copia de seguridad y recuperación de datos.

El rol de un administrador de base de datos es diferente del rol de un ingeniero de datos. Un administrador de base de datos supervisa y gestiona el estado general de una base de datos y el hardware en el que reside, mientras que un ingeniero de datos participa en el proceso de disputa de datos, en otras palabras, ingesta, transformación, validación y limpieza de datos para satisfacer las necesidades comerciales. y requisitos.

El administrador de la base de datos también es responsable de administrar la seguridad general de los datos, otorgando y restringiendo el acceso y los privilegios de los usuarios a los datos según lo determinen las necesidades y los requisitos comerciales.