(HIVE)
Descripción:
¿Qué
es Hive y por qué usarlo?
Apache Hive es un
sistema de almacén de datos para Hadoop, que permite realizar resúmenes de
datos, consultas y análisis de datos mediante HiveQL (un lenguaje de consultas
similar a SQL). Hive se puede usar para explorar los datos de forma interactiva
o para crear trabajos de procesamiento por lotes reutilizables.
Hive le permite proyectar la
estructura del proyecto en datos que en gran medida no están estructurados.
Después de definir la estructura, puede usar Hive para consultar esos datos sin
conocimiento de Java o MapReduce. HiveQL (el lenguaje de consultas de
Hive) permite escribir consultas con instrucciones similares a T-SQL.
S.O
Soportados
Windows 10, Windows 2000,
Windows 2003, Windows 7, Windows 8, Windows NT, Windows Vista, Windows XP.
Versiones
compatibles
Este conector de MongoDB admite la versión 2.4, 2.6, 3.0
y 3.2 de MongoDB.
Aplicaciones
Crear aplicaciones con
MongoDB, Spark y FreeMarker
Escalabilidad
-Número de usuarios
-Herramientas
de apoyo
Soporte
tecnico Hive
Por
defecto, cualquier tabla creada en la Hive es HDFS basa-; es decir, los
metadatos subyacentes y filas de datos asociadas a la tabla se almacena en
HDFS. Mongo-Hadoop ahora es compatible con la creación de las tablas de la
hive con sede en MongoDB y tablas basadas en la hive BSON. Tanto las
tablas de la hive MongoDB-basada y BSON basados en los cuadros de la hive pueden
ser:
- Consultado al igual que las tablas de la hive con sede en HDFS.
- En combinación con las tablas de la hive basados en HDFS se une y
sub-consultas
Costo
y tipo de licencia
El modelo del TCO asume que
Oracle requiere el doble de esfuerzo de desarrollo inicial con respecto a
MongoDB. Por lo tanto, para el proyecto de menor tamaño se asume un esfuerzo de
desarrollo de referencia de 24 meses-hombre para Oracle y de 12 meses-hombre
para MongoDB (una reducción del 50%); para el proyecto más grande se asumen 72
meses-hombre para Oracle y 36 meses hombre para MongoDB (una reducción del
50%). En ambos escenarios, se asume un sueldo de desarrollador completo de
120.000 $ anuales.
Requisitos:
Las versiones compatibles de
Hadoop y Hive
A partir de agosto de 2013,
sólo las versiones de hive <= 0,10 son estables. Actualmente
mongo-Hadoop Hive es compatible con versiones> = 0,9. Algunas clases y
funciones están en desuso en hive 0,11, pero siguen siendo funcional.
Versiones de Hadoop superior
a 0.20.x son compatibles. CDH4 es compatible, pero CDH3 con hive nativa
0.7 no lo es. Sin embargo, CDH3 es compatible con las versiones más
recientes de hive. La instalación de una versión no nativo con CDH3 se
puede utilizar con Mongo-Hadoop.
Consultas
https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usage
Autor Luis Eduardo Saldivar Garcia
No hay comentarios:
Publicar un comentario