Krypton Solid

La última tecnología en raciones de 5 minutos

Las aplicaciones de redes bayesianas están impulsando el soporte empresarial

Las redes bayesianas se han convertido en herramientas populares para los científicos de datos empresariales que trabajan con la predicción, ya que el auge de la computación en la nube barata y abundante ha dado paso a una infraestructura adaptable.

En un pasado más distante, las redes bayesianas seguían siendo en gran parte conceptuales, ya que la mayoría de los desarrolladores y empresas carecían de la potencia informática necesaria. Ahora, las organizaciones pueden usar infraestructuras basadas en la nube para varios tipos diferentes de resolución de problemas en paralelo en lugar de compartir tiempo en una costosa supercomputadora. Un modelo probabilístico poderoso, las redes bayesianas están experimentando una creciente popularidad debido a sus resultados fácilmente explicables y su capacidad para correlacionar variables.

¿Qué es una red bayesiana?

Como su nombre lo indica, las redes bayesianas se basan en el teorema de Bayes de probabilidad condicional, una rama de la estadística. Una red bayesiana es un modelo gráfico que representa un conjunto de variables y sus dependencias condicionales mediante un gráfico acíclico dirigido.

En lugar de dar un peso estático a las variables, una red bayesiana proporciona una distribución de probabilidad para crear una imagen completa del impacto de la variable en el resultado final. Como tal, los desarrolladores y usuarios pueden rastrear la métrica y la variable, así como su efecto de una manera más sencilla.

Chris Calvert, cofundador y director de tecnología del proveedor de software del centro de operaciones de seguridad Respond Software, ve el valor de las redes bayesianas en su opacidad.

«Con las redes neuronales, tienes que confiar en muchas cosas, mientras que con los enfoques de tipo de modelado gráfico probabilístico en redes bayesianas, puedes construir una decisión que se pueda supervisar fácilmente», dijo Calvert.

Los algoritmos utilizados en las redes bayesianas son capaces de inferencia y aprendizaje. En ciberseguridad, dijo Calvert, se utilizan para tomar decisiones que los humanos han tomado tradicionalmente: los humanos solo pueden considerar de tres a cinco factores a la vez, mientras que una red bayesiana puede considerar todos los factores observables.

Casos de uso

Las redes bayesianas se han utilizado con bastante frecuencia en entornos no comerciales y las empresas están empezando a tomar nota. Mediante el uso de redes bayesianas, los científicos de datos pueden predecir la probabilidad de que una de varias causas posibles sea el factor que contribuya a un resultado, lo que se presta a una variedad de aplicaciones para uso empresarial.

Los investigadores de ciberseguridad utilizan el razonamiento bayesiano y las redes bayesianas para identificar el malware. Por un lado, la identificación de malware requiere que una organización mire todos los archivos de registro, lo cual es una tarea tediosa y aburrida que no se adapta a los humanos. Además, dada la explosión de dispositivos, aplicaciones, navegadores y sistemas operativos conectados a Internet, los humanos no podrían seguir el ritmo si lo intentaran. Calvert dijo que incluso ha utilizado redes bayesianas para monitorear 50 centros de operaciones de seguridad simultáneamente.

«Un humano no sabrá que esta dirección IP [translates] a este hexadecimal porque los humanos no piensan en hechizo «, dijo.» Las máquinas naturalmente piensan en hechizo «.

Las redes bayesianas también se utilizan para mejorar la precisión de la microtargeting. Por ejemplo, si uno construyera una aplicación digital para un banco, un videojuego o una empresa de atención médica utilizando datos demográficos o personas, esa persona haría suposiciones erróneas sobre las personas porque la segmentación de la audiencia es demasiado burda y no todos los miembros de esos grupos son tan idénticos. como se supone que son.

Charlie Burgoyne, director ejecutivo y fundador de la consultora de ciencia de datos Valkyrie Intelligence, dijo que un enfoque más eficaz es agrupar a las personas por comportamiento, ya que un hombre blanco millennial y una mujer afroamericana boomer pueden actuar de manera similar en línea.

En el análisis predictivo, este problema común puede restringir las redes neuronales y la capacidad de la inteligencia artificial avanzada para apuntar a los usuarios con precisión.

«Una red bayesiana es una excelente manera de intentar predecir si tendré o no una experiencia de usuario positiva que aumente el compromiso en función de las diferentes actividades en las que participo y que tienen probabilidades de éxito», dijo Burgoyne.

El proveedor de tecnología de anonimización de datos Statice utiliza redes bayesianas para producir datos sintéticos. Los datos sintéticos se utilizan con fines de análisis de datos y aprendizaje automático cuando el uso de datos reales sería demasiado riesgoso (por ejemplo, registros médicos y financieros) o cuando la recopilación de datos es demasiado difícil o costosa.

«Lo que encuentro muy poderoso es que se pueden modelar los datos y la certeza del proceso generativo juntos», dijo José Pedro Valdés Herrera, científico de datos de Statice. «Necesitamos buenos modelos generativos que puedan crear datos sintéticos [and that] son compatibles con cualquier mecanismo de protección de la privacidad que necesite instalar «.

Limitaciones de las redes bayesianas

Las redes bayesianas requieren una gran cantidad de datos etiquetados para comprender las relaciones. Calvert dijo que el etiquetado de datos debe ser de colaboración colectiva para que el modelo pueda tener los datos que necesita para volverse «superinteligente».

«Al principio, fue difícil para nosotros obtener suficientes datos de seguridad porque son supersensibles, por lo que tuvimos que mostrarle a la gente cómo funciona esto: más datos, mejores decisiones, más datos, mejores decisiones», dijo Calvert. «Pronto, [a Bayesian network is] tomando mejores decisiones que las que los humanos han podido tomar y estamos listos para comenzar, pero existe esa ventana que es realmente difícil de atravesar «.

Otra limitación de las aplicaciones de las redes bayesianas tiene que ver con las condiciones y probabilidades. Por ejemplo, como señaló Burgoyne, cada paso incremental en una red bayesiana es una superposición de múltiples subprobabilidades, una encima de otra.

«La probabilidad de que un huevo se pudra no es una sola probabilidad», dijo Burgoyne. «Muchos miles de tipos diferentes de subprobabilidades encajan en ese [scenario] que están incompletos cuando se resumen como una probabilidad simple para uno de los nodos en un gráfico. Entonces, una limitación es que, aunque una red bayesiana está considerando la complejidad de las relaciones, depende de un resumen que a menudo es incompleto «.

Las redes bayesianas son solo una de las muchas herramientas que utilizan los científicos de datos para hacer predicciones. Dados sus fundamentos estadísticos (Teorema de Bayes), son adecuados para problemas que involucran probabilidades condicionales.

Muchos de los problemas actuales involucran la comprensión de las relaciones, razón por la cual las organizaciones han estado complementando sus bases de datos relacionales y multidimensionales tradicionales con bases de datos de gráficos. De manera similar, se necesita una variedad de técnicas de análisis de datos y aprendizaje automático para responder a diferentes tipos de preguntas. Una red bayesiana es un modelo gráfico probabilístico que representa un conjunto de variables y sus dependencias condicionales.

Deja un comentario

También te puede interesar...

¿Qué es el sistema de gestión de patio (YMS)?

Un sistema de gestión de patio (YMS) es un sistema de software diseñado para supervisar el movimiento de camiones y remolques en el patio de una instalación de fabricación, almacén o centro de distribución. YMS

La NFL está demandando al sitio web

La Liga Nacional de Fútbol Americano ha presentado una demanda contra NFLtoday.com y sus sitios web asociados, acusándola de uso no autorizado de su marca comercial. La demanda, presentada en el Tribunal de Distrito de

El error de ABC ve datos de usuario expuestos

Australian Broadcasting Corporation (ABC) envió un correo electrónico a los jugadores con el último juego de realidad aumentada (AR) «Pájaro azul«, Diciendo que los nombres, direcciones de correo electrónico y contraseñas estuvieron disponibles para su

Definición de Corporación C

¿Qué es una corporación C? AC Corporation (o C-corp) es una estructura legal para una corporación en la que los propietarios o accionistas pagan impuestos por separado de la entidad. Las sociedades C, la más

Pantone presenta dos colores del año para 2016

Pantone presenta dos colores del año para 2016 En una ruptura bastante radical con la tradición, Pantone ha revelado que el ‘Color del año’ para 2016, de hecho, habrá dos colores mezclados. O, en otras

Empiece con el análisis de datos

Amazon QuickSight es un buen ejemplo. El servicio es similar a Excel o Google Sheets, pero no es una herramienta de análisis de big data particularmente poderosa. QuickSight le permite crear tablas dinámicas, que son

Trampero pirateado, contraseñas en peligro

La popular aplicación de detección de la policía Trapster envió un correo electrónico a los usuarios, informándoles que la seguridad de la base de datos puede haber sido comprometida. La empresa con sede en Estados