martes, 28 de febrero de 2017

HIVE

(HIVE)
Descripción:
¿Qué es Hive y por qué usarlo?
Apache Hive es un sistema de almacén de datos para Hadoop, que permite realizar resúmenes de datos, consultas y análisis de datos mediante HiveQL (un lenguaje de consultas similar a SQL). Hive se puede usar para explorar los datos de forma interactiva o para crear trabajos de procesamiento por lotes reutilizables.
Hive le permite proyectar la estructura del proyecto en datos que en gran medida no están estructurados. Después de definir la estructura, puede usar Hive para consultar esos datos sin conocimiento de Java o MapReduce. HiveQL (el lenguaje de consultas de Hive) permite escribir consultas con instrucciones similares a T-SQL.

S.O Soportados
Windows 10, Windows 2000, Windows 2003, Windows 7, Windows 8, Windows NT, Windows Vista, Windows XP.
Versiones compatibles
Este conector de MongoDB admite la versión 2.4, 2.6, 3.0 y 3.2 de MongoDB.
Aplicaciones
Crear aplicaciones con MongoDB, Spark y FreeMarker

                                                         
Escalabilidad
 -Número de usuarios
-Herramientas de apoyo
Soporte tecnico Hive
Por defecto, cualquier tabla creada en la Hive es HDFS basa-; es decir, los metadatos subyacentes y filas de datos asociadas a la tabla se almacena en HDFS. Mongo-Hadoop ahora es compatible con la creación de las tablas de la hive con sede en MongoDB y tablas basadas en la hive BSON. Tanto las tablas de la hive MongoDB-basada y BSON basados ​​en los cuadros de la hive pueden ser:
  • Consultado al igual que las tablas de la hive con sede en HDFS.
  • En combinación con las tablas de la hive basados ​​en HDFS se une y sub-consultas
Costo y tipo de licencia
El modelo del TCO asume que Oracle requiere el doble de esfuerzo de desarrollo inicial con respecto a MongoDB. Por lo tanto, para el proyecto de menor tamaño se asume un esfuerzo de desarrollo de referencia de 24 meses-hombre para Oracle y de 12 meses-hombre para MongoDB (una reducción del 50%); para el proyecto más grande se asumen 72 meses-hombre para Oracle y 36 meses hombre para MongoDB (una reducción del 50%). En ambos escenarios, se asume un sueldo de desarrollador completo de 120.000 $ anuales.

Requisitos:
Las versiones compatibles de Hadoop y Hive
A partir de agosto de 2013, sólo las versiones de hive <= 0,10 son estables. Actualmente mongo-Hadoop Hive es compatible con versiones> = 0,9. Algunas clases y funciones están en desuso en hive 0,11, pero siguen siendo funcional.
Versiones de Hadoop superior a 0.20.x son compatibles. CDH4 es compatible, pero CDH3 con hive nativa 0.7 no lo es. Sin embargo, CDH3 es compatible con las versiones más recientes de hive. La instalación de una versión no nativo con CDH3 se puede utilizar con Mongo-Hadoop.

Consultas

https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usage


Autor Luis Eduardo Saldivar Garcia

No hay comentarios:

Publicar un comentario