Placeholder text

Deduplicación eficiente de datos en Hadoop

Deduplicación eficiente de datos en Hadoop

0 - Default Title
Description
Hadoop se utiliza ampliamente para el almacenamiento masivo de datos distribuidos. Aunque es muy tolerante a fallos, escalable y funciona con hardware básico, no proporciona una solución de almacenamiento de datos eficiente y optimizada. Cuando el usuario sube archivos con el mismo contenido a Hadoop, este almacena todos los archivos en HDFS (Hadoop Distributed File System), incluso si el contenido es el mismo, lo que provoca la duplicación del contenido y, por lo tanto, un desperdicio de espacio de almacenamiento. La deduplicación de datos es un proceso que reduce la capacidad de almacenamiento necesaria, ya que solo se almacenan las instancias únicas de datos. El proceso de deduplicación de datos se utiliza ampliamente en servidores de archivos, sistemas de gestión de bases de datos, almacenamiento de copias de seguridad y muchas otras soluciones de almacenamiento. Una estrategia de deduplicación adecuada utiliza de forma adecuada el espacio de almacenamiento en dispositivos de almacenamiento limitados. Hadoop no ofrece una solución de deduplicación de datos. En este trabajo, se ha integrado el módulo de deduplicación en el marco de Hadoop para lograr un almacenamiento de datos optimizado.
Product details
Binding:
Paperback
Number of Pages:
76
Publication Date:
2025-09-18
Publisher:
Ediciones Nuestro Conocimiento
Languages:
Original: Spanish
ISBN10:
6202087285
ISBN13:
9786202087285
Weight:
131 g
Height:
150 cm
Width:
220 cm
Thickness:
5 cm
Currently sold out