Krypton Solid

La última tecnología en raciones de 5 minutos

ModelDB tiene como objetivo realizar un seguimiento del proceso de modelado de aprendizaje automático

BOSTON – Sam Madden, profesor de ingeniería eléctrica e informática en el MIT, espera ayudar a avanzar en el campo del aprendizaje automático del arte oscuro a la ciencia basada en principios con un proyecto de código abierto. ModelDB, disponible en GitHub, es esencialmente un sistema de base de datos diseñado para ayudar a organizar y administrar modelos de aprendizaje automático.

“Estos modelos son los motores del aprendizaje automático”, dijo Madden en la conferencia MassIntelligence, organizada por MassTLC y el Laboratorio de Inteligencia Artificial y Ciencias de la Computación del MIT. «Son las cosas que toman los datos y extraen la información de ellos».

Cuando los investigadores crean modelos de aprendizaje automático, el proceso es muy iterativo. Los modelos se crean utilizando datos de entrenamiento y, si son modelos supervisados, se prueban, evalúan y luego se modifican (es decir, se agregan nuevas funciones, se agregan nuevos parámetros) para mejorar su rendimiento. Ese proceso se repite, a veces cientos de miles de veces, según Madden, hasta que los modelos funcionan a un nivel aceptable.

Pero no hay forma de gestionar el proceso. «Pasas por miles de estos modelos, actualizas los modelos todo el tiempo y no hay ningún tipo de forma estandarizada de rastrear el historial del proceso de modelado», dijo.

Madden lo comparó con la forma en que las personas organizan los documentos personales en sus computadoras, es decir, no en absoluto. «La gente es terrible en eso», dijo. «Y no promueven datos cuidadosamente organizados».

ModelDB es un sistema de base de datos que actúa como un repositorio central para los modelos de aprendizaje automático (todas las iteraciones) y se puede buscar, creando un sistema de registro para los investigadores. “La gente puede ver lo que se ha hecho en el pasado y continuar con el trabajo que se ha completado parcialmente”, dijo Madden.

Las características incluyen «seguimiento de experimentos», de modo que se puedan registrar los modelos en proceso; «Control de versiones» o la capacidad de comparar el rendimiento del modelo; y «reproducibilidad», de modo que cualquier modelo pueda volver a ejecutarse y cualquier conjunto de datos de entrada.

“Esta no es una idea profunda o radicalmente complicada”, dijo. “Pero es una de las cosas que creo que se necesitan para que podamos ir de donde estamos ahora, que es algo así [dark] arte, a un enfoque científico mucho más basado en principios «.

Deja un comentario

También te puede interesar...

definicion de crack

¿Qué es el agrietamiento? El craqueo es una técnica utilizada en las refinerías de petróleo mediante la cual las moléculas de hidrocarburos grandes y complejas se descomponen en componentes más pequeños y livianos, que son

Reseña de Paypal Extras Mastercard

Paypal Extras Mastercard no es una de nuestras principales tarjetas de crédito con devolución de efectivo. Puede consultar nuestra lista de los mejores pagos con tarjeta de crédito para conocer las que creemos que son

Wi-Fi utilizado para servicios de ubicación

Una empresa de nueva creación en Boston, Massachusetts, dice que ha desarrollado un software que utiliza señales Wi-Fi para identificar ubicaciones mejor que los sistemas de posicionamiento global basados ​​en satélites. Los lunes Skyhook Wireless

Wi-Fi para llegar a estaciones en el Reino Unido

A los usuarios de portátiles y PDA pronto se les ofrecerá acceso inalámbrico a Internet de alta velocidad en 15 estaciones importantes del Reino Unido. Megabeam, un proveedor europeo de servicios de Internet inalámbrico, dijo

Definición de ejercicio.

¿Qué es el ejercicio? Ejercicio significa el ejercicio del derecho a comprar o vender el instrumento financiero subyacente especificado en un contrato de opción. En el comercio de opciones, el tenedor de una opción tiene

Microsoft: somos buenos para su salud

Microsoft ha informado intenciones de ingresar al espacio de administración de registros de salud durante más de un año. El 4 de octubre, la compañía finalmente entregó un plan de juego oficial con lo que

Oferta de derechos (emisión)

¿Qué es una oferta (emisión) de derechos? Una oferta de derechos (emisión de derechos) es un grupo de derechos ofrecidos a los accionistas existentes para comprar acciones adicionales, conocidas como warrants de suscripción, en proporción

¿Conocerás a tu médico mañana?

Los defensores de la tecnología sanitaria se enfrentan a una verdad incómoda. Un beneficio de salud esencial de la TI es convertir a los médicos en gerentes. El tiempo de un médico es caro. Son