Blog Nubity
diciembre 2018
L M X J V S D
« Nov    
 12
3456789
10111213141516
17181920212223
24252627282930
31  

Categorías


Blog Nubity

Object storage y Block storage: Éstas son las diferencias

Conoce las diferencias entre el almacenamiento basado en bloque y basado en objetos

Josué BeltránJosué Beltrán

Incluso personas muy técnicas se rascan la cabeza para comprender el valor comercial del Object Storage. En otras palabras, ¿qué problemas resuelve? ¿Cuáles son sus inconvenientes y limitaciones? ¿Qué tipos de aplicaciones se ejecutan mejor, qué interrupciones y qué se necesita para rediseñar completamente y aprovechar cada tecnología de almacenamiento?

Te puede interesar: [Infografía] Backups físicos vs en la nube

Los administradores de TI desean saber si el Object Storage o el Block Storage son adecuados para determinadas cargas de trabajo. En este artículo, se definirá el Object Storage y el Block Storage, y los compararemos con alternativas y proporcionaremos una descripción general de dónde puede hacer una diferencia de rendimiento para la informática empresarial.

¿Qué es el  Object Storage?

El almacenamiento de objetos (también conocido como almacenamiento basado en objetos Object-based storage) es un término general que se refiere a la forma en que las organizamos y trabajamos con unidades de almacenamiento, mismas que llamamos objetos. Cada objeto contiene tres cosas:

  1. Los datos en sí. Los datos pueden ser cualquier cosa que desee almacenar, desde una foto familiar hasta un manual de 400,000 páginas para ensamblar una aeronave.
  2. Una cantidad expansible de metadatos. Los metadatos están definidos por quien crea el almacenamiento de objetos; contiene información contextual sobre qué datos son, para qué se debe usar, su confidencialidad o cualquier otra cosa que sea relevante para la forma en que se utilizan los datos.
  3. Un identificador global único. El identificador es una dirección dada al objeto para que el objeto se encuentre sobre un sistema distribuido. De esta forma, es posible encontrar los datos sin tener que conocer la ubicación física de los datos (que podrían existir en diferentes partes de un centro de datos o en diferentes partes del mundo).

Cómo se diferencian el almacenamiento en bloque y el almacenamiento de objetos

Con el Block Storage (almacenamiento en bloques), los archivos se dividen en bloques de datos de tamaño uniforme, cada uno con su propia dirección pero sin información adicional (metadatos) que proporcione más contexto de lo que es ese bloque de datos. Se puede encontrar almacenamiento en bloque en la mayoría de las cargas de trabajo empresariales. El Block Storage tiene una amplia variedad de usos (como se ve por el aumento en la popularidad de las matrices SAN).

El Object Storage (almacenamiento de objetos), por el contrario, no divide los archivos en bloques de datos sin formato. En cambio, grupos enteros de datos se almacenan en, sí, un objeto que contiene los datos, los metadatos y el identificador único. No hay límite en el tipo o la cantidad de metadatos, lo que hace que el almacenamiento de objetos sea poderoso y personalizable. Los metadatos pueden incluir cualquier cosa, desde la clasificación de seguridad del archivo dentro del objeto hasta la importancia de la aplicación asociada con la información. Cualquiera que haya almacenado una imagen en Facebook o una canción en Spotify ha utilizado el almacenamiento de objetos incluso si no lo sabe. En el centro de datos de la empresa, el almacenamiento de objetos se utiliza para estos mismos tipos de necesidades de almacenamiento, donde los datos deben estar altamente disponibles y ser muy duraderos.

Sin embargo, el almacenamiento de objetos generalmente no le proporciona la capacidad de editar incrementalmente una parte de un archivo (como lo hace el almacenamiento en bloques). Los objetos deben manipularse como una unidad completa, requiriendo que se acceda, actualice y, a continuación, vuelva a escribir el objeto completo en su totalidad. Eso puede tener implicaciones de rendimiento.

Otra diferencia clave es que el sistema operativo puede acceder directamente al almacenamiento de bloques como un volumen de unidad montado, mientras que el almacenamiento de objetos no puede hacerlo sin una degradación significativa del rendimiento. La compensación aquí es que, a diferencia del almacenamiento de objetos, la sobrecarga de administración de almacenamiento de almacenamiento en bloque (como la reasignación de volúmenes) es relativamente inexistente.

¿Qué problemas resuelve el almacenamiento de objetos?

El almacenamiento de objetos es ideal para resolver los crecientes problemas de crecimiento de datos. A medida que se generan más y más datos, los sistemas de almacenamiento deben crecer al mismo ritmo. ¿Qué sucede cuando intenta expandir un sistema de almacenamiento basado en bloques más allá de cien terabytes o más allá de varios petabytes? Puede encontrarse con problemas de durabilidad, grandes limitaciones con la infraestructura de almacenamiento que tiene actualmente, o con los gastos generales de administración que pueden llegar al techo.

La solución de problemas de administración de aprovisionamiento presentada por la expansión del almacenamiento en esta escala es donde brilla el almacenamiento de objetos. Los elementos como el contenido web estático, la copia de seguridad de datos y los archivos son casos de uso fantásticos. Las arquitecturas de almacenamiento basadas en objetos se pueden escalar y administrar simplemente agregando nodos adicionales. La organización del espacio de nombre plano de los datos, en combinación con su funcionalidad de metadatos expandibles, facilita esta facilidad de uso.

Otra ventaja de objetar el almacenamiento es su capacidad de respuesta a la necesidad de resiliencia a la vez que mitiga los costos. Los objetos permanecen protegidos almacenando múltiples copias de datos a través de un sistema distribuido; si uno o más nodos fallan, los datos aún pueden estar disponibles, en la mayoría de los casos, sin que la aplicación o el usuario final se vean afectados. (¿Tiempo de inactividad? ¿Qué tiempo de inactividad?) En la mayoría de los casos, se almacenan al menos tres copias de cada archivo. Esto resuelve problemas comunes que incluyen fallas en el disco, rotura de bit, servidor y fallas, y cortes de energía. Este diseño de almacenamiento distribuido para alta disponibilidad permite que se use hardware básico menos costoso porque la protección de datos está integrada en la arquitectura del objeto.

¿Qué hay de las compensaciones?

El almacenamiento de objetos tiene el potencial de proporcionar a los departamentos de TI una gran cantidad de valor. Puede ahorrar dinero en costos de infraestructura al permitir que la organización utilice hardware menos costoso, puede reducir el tiempo de administración a través de la facilidad de escalabilidad, y brinda una tremenda flexibilidad para ciertos tipos de necesidades de almacenamiento.

Pero, por emocionante que parezca, el almacenamiento de objetos no es la respuesta a todos sus problemas de almacenamiento. A veces, el almacenamiento en bloque es mucho mejor. Hay casos de uso en los que el almacenamiento de objetos funciona maravillosamente, aumenta de manera uniforme y resuelve todo tipo de dolores de cabeza de la administración, pero en otras situaciones no cumple con las necesidades de su aplicación.

Debe decidir qué tipo de enfoque arquitectónico es el adecuado para sus necesidades, ya que equilibra los requisitos de una solución de almacenamiento escalable que brinde flexibilidad y rendimiento. Los problemas principales son consistencia eventual o consistencia fuerte. Los sistemas de almacenamiento de objetos son eventualmente consistentes, mientras que los sistemas de almacenamiento de bloques son muy consistentes.

La consistencia eventual puede proporcionar una escalabilidad prácticamente ilimitada. Garantiza una alta disponibilidad para los datos que deben almacenarse de manera duradera, pero es relativamente estático y no cambiará mucho, si es que lo hace. Esta es la razón por la que almacenar fotos, videos y otros datos no estructurados es un caso de uso ideal para los sistemas de almacenamiento de objetos; no necesita ser alterado constantemente. La desventaja de la coherencia final es que no hay garantía de que una solicitud de lectura devuelva la versión más reciente de los datos.

Se necesita una coherencia sólida para los sistemas en tiempo real, como las bases de datos transaccionales en las que se escriben constantemente, pero que ofrecen una escalabilidad limitada y una disponibilidad reducida como resultado de fallas de hardware. La escalabilidad se vuelve aún más difícil dentro de un sistema geográficamente distribuido. Sin embargo, una consistencia sólida es un requisito siempre que una solicitud de lectura deba devolver la versión más actualizada de los datos.

Cargas de trabajo para el almacenamiento de objetos frente a bloques

El almacenamiento de objetos funciona muy bien para conjuntos de datos no estructurados donde los datos generalmente se leen, pero no se escriben. El contenido web estático, las copias de seguridad de datos y las imágenes de archivo, y los archivos multimedia (videos, imágenes o música) se almacenan mejor como objetos. Las bases de datos en un entorno de almacenamiento de objetos idealmente tienen conjuntos de datos que no están estructurados, donde los casos de uso sugieren que los datos no requerirán una gran cantidad de escrituras o actualizaciones incrementales.

El almacenamiento de back-end geográficamente distribuido es otro gran caso de uso para el almacenamiento de objetos. El objeto almacena aplicaciones presentes como almacenamiento de red y admite metadatos extensibles para una distribución eficiente y acceso paralelo a los objetos. Eso lo hace ideal para mover sus clústeres de almacenamiento de fondo a través de múltiples centros de datos.

No recomendamos el uso de almacenamiento de objetos para datos transaccionales, especialmente debido al modelo de coherencia eventual descrito anteriormente. Además, es muy importante reconocer que el almacenamiento de objetos no se creó como un reemplazo para el acceso y el intercambio de archivos NAS; no admite los mecanismos de bloqueo y compartición necesarios para mantener una única versión de un archivo actualizada con precisión.

Debido a que los dispositivos de almacenamiento de nivel de bloque son accesibles como volúmenes y el sistema operativo accede directamente a ellos, pueden funcionar bien para una variedad de casos de uso. Buenos ejemplos de casos de uso de almacenamiento en bloque son el almacenamiento estructurado de la base de datos, las cargas aleatorias de lectura / escritura y los volúmenes del sistema de archivos de máquina virtual (VMFS). Sin embargo, dado que el almacenamiento en bloque no tiene esencialmente metadatos adicionales del lado del almacenamiento que puedan asociarse con un bloque dado que no sea la dirección de ese bloque, el rendimiento se degrada en sistemas distribuidos geográficamente. Cuanto más se obtiene el almacenamiento en bloque de la aplicación, más sufre el rendimiento debido a problemas de latencia.

Almacenamiento de objetos en la práctica

A pesar de lo que algunas personas sugieren, el almacenamiento de objetos no es una tecnología emergente. Los datos almacenados como objetos ya se han acercado a la escala exabyte (1000 petabytes) que representan trillones de objetos. Empresas como Amazon (con S3) proporcionan almacenamiento de objetos a través de su plataforma de nube pública a gran escala, mientras que el almacenamiento de objetos se puede implementar en el centro de datos de la compañía utilizando tecnología como Swift de OpenStack o Atmos de EMC.

Cuando empiece a pensar qué tipos de artículos debe trasladar al almacenamiento de objetos, comience con la fruta más baja. Eche un vistazo, por ejemplo, a bajas cargas de trabajo de E / S, como el recurso compartido de red, que puede estar en un dispositivo NAS. En este caso, está limitado al tamaño de la unidad. Sin una opción que se pueda expandir fácilmente, se verá forzado a aprovisionar en exceso para dejar espacio para futuras expansiones para los usuarios, lo que resultará en una subutilización. Al mover esta carga de trabajo a un almacén de objetos, no está limitado a la cantidad de espacio que tiene cada unidad. Los nodos se pueden agregar fácilmente dentro del paradigma de almacenamiento de objetos, lo que permite el uso completo de los discos que compraste.

Independientemente del camino que elija, es importante familiarizarse con las ventajas y limitaciones de la arquitectura para obtener el mayor valor para su empresa.

¿Estás a poco de migrar y no sabes qué tipo de almacenamiento elegir? Inicia un chat con un experto de Nubity quien te podrá ayudar a elegir el almacenamiento que agregue mayor valor a tu empresa.

Iniciar chat

Comments 0
There are currently no comments.

Deja un comentario

A %d blogueros les gusta esto: