Krypton Solid

La última tecnología en raciones de 5 minutos

¿Qué es Apache Pig? – Definición de Krypton Solid

Apache Pig es una tecnología de código abierto que ofrece un mecanismo de alto nivel para la programación paralela de trabajos de MapReduce que se ejecutarán en clústeres de Hadoop.

Pig permite a los desarrolladores crear rutinas de ejecución de consultas para analizar grandes conjuntos de datos distribuidos sin tener que hacer un trabajo de bajo nivel en MapReduce, de manera muy similar a la forma en que el software de almacenamiento de datos Apache Hive proporciona una interfaz similar a SQL para Hadoop que no requiere Programación MapReduce,

Las partes clave de Pig son un compilador y una secuencia de comandos. Lengua conocida como Pig Latin. Pig Latin es un datolenguaje de flujo orientado al procesamiento paralelo. Los gerentes del proyecto Pig de la Apache Software Foundation posicionan el lenguaje como un medio entre el SQL declarativo y el enfoque de procedimiento de Java utilizado en las aplicaciones MapReduce. Los defensores dicen, por ejemplo, que las uniones de datos son más fáciles de crear con Pig Latin que con Java. Sin embargo, mediante el uso de funciones definidas por el usuario (UDF), las aplicaciones de Pig Latin se pueden ampliar para incluir tareas de procesamiento personalizadas escritas en Java, así como lenguajes como JavaScript y Python.

Apache Pig surgió de su trabajo en Yahoo Research y se describió formalmente por primera vez en un artículo publicado en 2008. Pig está destinado a manejar todo tipo de datos, incluida la información estructurada y no estructurada y los datos relacionales y anidados. Esa visión omnívora de los datos probablemente influyó en la decisión de nombrar el medio ambiente para el animal de corral común. También se extiende a la versión de Pig de los marcos de aplicaciones; Si bien la tecnología está asociada principalmente con Hadoop, se dice que también puede usarse con otros marcos.

El marco Hadoop subyacente surgió a partir de aplicaciones web a gran escala cuyos arquitectos eligieron métodos distintos de SQL para recopilar y analizar cantidades masivas de datos de forma económica. Tiene mucha ayuda adicional para manejar aplicaciones de big data porque Apache Pig es solo parte de una larga lista de tecnologías del ecosistema Hadoop que también incluye Hive, HBase, ZooKeeper y otras utilidades destinadas a llenar en las lagunas de funcionalidad en el marco.

Esto se actualizó por última vez en Enero 2014

Continuar leyendo sobre Apache Pig

Deja un comentario

También te puede interesar...

Registros de reporteros accedidos en la sonda de HP

Un contratista contratado por Hewlett-Packard accedió a los registros telefónicos personales de dos reporteros de CNET News.com para averiguar la fuente de las filtraciones desde la sala de juntas a los medios, según la oficina

Definición de margen de suscripción

¿Qué es el diferencial de suscripción? Un diferencial de suscripción es la diferencia entre el monto en dólares que los suscriptores, como los bancos de inversión, pagan a una empresa emisora ​​por sus valores y

Samsung contradice a Apple en Australia

Haciendo bien una amenaza legal hecha hace tres semanas En el Tribunal Federal de Nueva Gales del Sur, el gigante coreano de la electrónica Samsung demandó a Apple por infracción de propiedad intelectual y patente,

Cómo gestionar los plazos

Cómo gestionar los plazos Los autónomos (y cualquier otra persona que trabaje por su cuenta) saben que la marea del trabajo fluye y refluye. Hay pocas dudas, entonces, de que dada la naturaleza bastante caprichosa

Definición de impuesto a la seguridad social

¿Qué es un impuesto de seguridad social? El Impuesto de Seguridad Social es el impuesto que grava tanto a los empleadores como a los empleados para financiar el programa de seguridad social en los Estados

Red Hat, Intel planea 17 centros de desarrollo

BOSTON – Intel y Red Hat anunciaron el martes planes para abrir más de una docena de centros donde los clientes y socios comerciales pueden asegurarse de que su software funcione bien en Linux y

Solo para evaluación (FVO)

Qué es solo para evaluación (FVO) Sólo para valoración (FVO) es una notación incluida en una cotización nominal de un título. Los creadores de mercado utilizan las cotizaciones de FVO para ayudar a determinar el

Manejar el estrés financiero y mental

La planificación anticipada es la mejor manera de aliviar el estrés financiero y la ansiedad que enfrentaron muchos estadounidenses durante la pandemia de COVID-19, según un grupo de expertos financieros que asistieron a la conferencia

Cómo configurar mIRC | Krypton Solid

Alguna vez has oído hablar de mIRC? Es un programa muy famoso para conectarse a red IRC (Internet Relay Chat) disponible exclusivamente para sistemas Windows. La red IRC, en caso de que nunca haya oído