Algunos en la industria del software de bases de datos se muestran escépticos ante la propuesta de que las bases de datos gráficas son vitales para la aplicación de IA …
desarrollo. Después de todo, casi todo parece tener un ángulo de IA en estos días.
Pero, para la base de datos de gráficos de Neo4j, la IA ha demostrado ser un campo fértil. La compañía cuenta a Caterpillar y eBay entre los usuarios que lo han incorporado a sus aplicaciones de inteligencia artificial.
La conexión entre la inteligencia artificial y las bases de datos de gráficos es genuina, según Adrian Bowles, analista de Storm Insights. Cuando observa la arquitectura interna de la IA, dijo, encuentra una clara necesidad de comprender las interrelaciones de los datos.
«En IA, la forma en que representas el conocimiento que estás manejando es muy importante», dijo Bowles. «Mucho de eso se trata de tratar de comprender cómo encajan los datos».
Ingrese a sistemas como la base de datos de gráficos de Neo4j Inc., estructurada para ayudar a descubrir las relaciones entre los puntos de datos.
Análisis forense de datos gráficos
Bowles contrastó la estructura de datos de gráficos, generalmente basada en tiendas triples en las que los nodos de datos están conectados a través de bordes a otros nodos relacionados, con bases de datos relacionales más familiares que, a pesar de su nombre, tienen una forma indirecta de manejar las relaciones.
Considere el trabajo forense realizado en los misterios de la televisión, en el que tarjetas de índice, fotografías policiales y similares están en paneles de corcho y están conectados con cuerdas de cometas como gráficos.
Adrian BowlesStorm Insights
«Nadie ve un programa de detectives y espera verlos colocando cosas en filas y columnas como lo hacen las bases de datos relacionales», dijo Bowles. «No es así como piensa la gente».
La conexión entre las bases de datos de gráficos y la IA ha sido notada por otros además de Neo4j, que se enfrenta a una considerable finalización en un campo aún nuevo. Por ejemplo:
- IBM Watson, que tuvo un papel importante en devolver la inteligencia artificial a un primer plano después de muchos años casi en hibernación, incluye un gráfico de conocimiento como parte de su diseño general para poner los datos en contexto.
- Franz Inc., pionero del lenguaje Lisp, ofrece la base de datos AllegroGraph para trabajar en casos de uso de inteligencia artificial y conocimiento experto.
- Cambridge Semantics proporciona la base de datos AnzoGraph paralelizada para análisis y procesamiento de datos semánticos.
Modelos de aprendizaje automático
Philip Rathle, vicepresidente de productos de Neo4j, cita el aprendizaje automático, uno de los subconjuntos más activos de la IA, como un área que puede beneficiarse de la base de datos gráfica de Neo4j.
«Si observa los casos de uso de aprendizaje automático, lo que la gente hace es tomar un montón de atributos y luego definirlos como entradas para entrenar el modelo de aprendizaje automático», dijo. «Estas entradas son en su mayoría datos individuales desconectados».
Un enfoque importante de las aplicaciones de IA en la actualidad, y a menudo un obstáculo para implementaciones exitosas, es seleccionar correctamente los atributos para el entrenamiento de modelos. Ese proceso, dijo Rathle, se mejora mediante el uso de datos gráficos.
«Lo importante es descubrir cómo se conectan los datos, y los gráficos son buenos para eso», dijo.
Rathle habló en una entrevista reciente, después de que se lanzara la versión beta 3.5 de la base de datos de gráficos de Neo4j. La base de datos incluye indexación de texto completo para trabajos de procesamiento de lenguaje natural y nuevos algoritmos de gráficos para caminata aleatoria, DeepWalk y otros métodos de aprendizaje no supervisados, dijo.
Rathle dijo que la base de datos de gráficos de Neo4j ha obtenido mejoras de rendimiento con indexación nativa para una clasificación de consultas más rápida y un subsistema de memoria de transacciones dedicado para manejar grandes escrituras de datos.
Conectando creatividades
Mientras tanto, la base de datos de gráficos de Neo4j ha demostrado ser un motor útil para un sistema de Adobe que une a los miembros de su comunidad creativa Behance, según un desarrollador que ha estado involucrado en parte de su evolución. Adobe se ha centrado cada vez más en el mantenimiento de esquemas y sistemas.
Los equipos de Adobe probaron algunas bases de datos NoSQL antes de decidirse por la base de datos gráfica de Neo4j para impulsar fuentes de contenido personalizado que alertaran a los miembros de Behance sobre la actividad de otros usuarios, dijo David Fox, ingeniero de software de Adobe. Podría decirse que tales fuentes de redes sociales siguen siendo una de las áreas principales del desarrollo de aplicaciones de inteligencia artificial.
Fox dijo que el formato de la base de datos de gráficos es una forma eficiente de crear relaciones de mapas entre puntos de datos. Anteriormente, Adobe empleó un MongoDB base de datos de documentos y luego una base de datos de almacén de valores-clave orientada a columnas de Cassandra.
La implementación de MongoDB requirió una cantidad considerable de servidores y la configuración del esquema generó problemas de rendimiento, dijo Fox.
«Con Cassandra, las lecturas de datos fueron rápidas, pero la capacidad de mantenimiento y el modelo de datos se convirtieron en problemas», dijo.
«Descubrimos que la base de datos era difícil de mantener a medida que crecían los datos». Dijo que las correcciones de errores en curso tendían a consumir una buena cantidad de tiempo del desarrollador y que agregar funciones era difícil. Pasar a un formato de gráfico condujo a una reducción considerable del tamaño de los datos.
Fox dijo que Neo4j permitió a los equipos de TI reducir el conjunto de datos de trabajo de 50 TB a 40 GB, y un clúster de tres instancias de Neo4j se encuentra en el lugar donde una vez sirvieron 48 instancias de Cassandra.
Fox dijo que aún no había revisado la última versión de la base de datos gráfica de Neo4j, pero que está interesado en las mejoras de visualización de la interfaz que podrían permitir a los usuarios de la línea de negocio analizar los datos de Behance.
Los saltos que Adobe tuvo que hacer en los diseños de sistemas avanzados no son únicos entre las empresas de rápido movimiento en la actualidad. Arranques, paradas y flexibilidad son palabras clave mientras los equipos de desarrollo de datos luchan con nuevos enfoques. Y, aunque el progreso puede medirse y moderarse, las bases de datos de gráficos parecen cada vez más populares.