Deduplicación eficiente de datos en Hadoop

Name: Deduplicación eficiente de datos en Hadoop
Brand: Ediciones Nuestro Conocimiento
Availability: OutOfStock
Rating: 5 (1 reviews)

By Priteshkumar Prajapati

0 - Default Title

Description

Hadoop se utiliza ampliamente para el almacenamiento masivo de datos distribuidos. Aunque es muy tolerante a fallos, escalable y funciona con hardware básico, no proporciona una solución de almacenamiento de datos eficiente y optimizada. Cuando el usuario sube archivos con el mismo contenido a Hadoop, este almacena todos los archivos en HDFS (Hadoop Distributed File System), incluso si el contenido es el mismo, lo que provoca la duplicación del contenido y, por lo tanto, un desperdicio de espacio de almacenamiento. La deduplicación de datos es un proceso que reduce la capacidad de almacenamiento necesaria, ya que solo se almacenan las instancias únicas de datos. El proceso de deduplicación de datos se utiliza ampliamente en servidores de archivos, sistemas de gestión de bases de datos, almacenamiento de copias de seguridad y muchas otras soluciones de almacenamiento. Una estrategia de deduplicación adecuada utiliza de forma adecuada el espacio de almacenamiento en dispositivos de almacenamiento limitados. Hadoop no ofrece una solución de deduplicación de datos. En este trabajo, se ha integrado el módulo de deduplicación en el marco de Hadoop para lograr un almacenamiento de datos optimizado.

Product details

Binding:

Paperback

Number of Pages:

76

Publication Date:

2025-09-18

Publisher:

Ediciones Nuestro Conocimiento

Languages:

Original: Spanish

ISBN10:

6202087285

ISBN13:

9786202087285

Weight:

131 g

Height:

150 cm

Width:

220 cm

Thickness:

5 cm

Buy on Amazon

Currently sold out