{"product_id":"prajapati-priteshkumar-deduplicacion-eficiente-de-datos-en-hadoop-9786202087285","title":"Deduplicación eficiente de datos en Hadoop","description":"Hadoop se utiliza ampliamente para el almacenamiento masivo de datos distribuidos. Aunque es muy tolerante a fallos, escalable y funciona con hardware básico, no proporciona una solución de almacenamiento de datos eficiente y optimizada. Cuando el usuario sube archivos con el mismo contenido a Hadoop, este almacena todos los archivos en HDFS (Hadoop Distributed File System), incluso si el contenido es el mismo, lo que provoca la duplicación del contenido y, por lo tanto, un desperdicio de espacio de almacenamiento. La deduplicación de datos es un proceso que reduce la capacidad de almacenamiento necesaria, ya que solo se almacenan las instancias únicas de datos. El proceso de deduplicación de datos se utiliza ampliamente en servidores de archivos, sistemas de gestión de bases de datos, almacenamiento de copias de seguridad y muchas otras soluciones de almacenamiento. Una estrategia de deduplicación adecuada utiliza de forma adecuada el espacio de almacenamiento en dispositivos de almacenamiento limitados. Hadoop no ofrece una solución de deduplicación de datos. En este trabajo, se ha integrado el módulo de deduplicación en el marco de Hadoop para lograr un almacenamiento de datos optimizado.","brand":"Ediciones Nuestro Conocimiento","offers":[{"title":"Default Title","offer_id":53750800318806,"sku":null,"price":0.0,"currency_code":"EUR","in_stock":false}],"url":"https:\/\/www.momoxbooks.com\/products\/prajapati-priteshkumar-deduplicacion-eficiente-de-datos-en-hadoop-9786202087285","provider":"momoxbooks","version":"1.0","type":"link"}