Cambios de almacenamiento de datos para SharePoint 2010

Artículo original publicado el sábado, 9 de julio de 2011

​Hoy anunciamos dos cambios relacionados con la manera en que describimos el almacenamiento de datos en SharePoint. Primero, mediante el aprovechamiento de mejoras de rendimiento y fiabilidad en SP1 y mediante la definición de requisitos específicos para almacenamiento de datos de gran tamaño en SharePoint, Microsoft puede aumentar los límites admitidos para almacenamiento de datos en SharePoint.

 Además, anunciamos que el proveedor de secuencia de archivo RBS para SQL Server ahora es compatible para uso con SharePoint para que se pueda usar un disco NAS conectado por iSCSI de coste más bajo. Esta entrada de blog aborda los nuevos límites y las nuevas pautas de compatibilidad de almacenamiento de datos para escalar a esos límites, y define RBS incluido el nuevo proveedor de secuencia de archivo RBS.

 

Límite de tamaño de datos para base de datos de contenido de SharePoint

Con el lanzamiento de SharePoint 2010 SP1 y orientación nueva, estamos cambiando los límites de tamaño de datos compatibles para las bases de datos de contenido de SharePoint. Antes de SP1, el límite de base de datos de contenido era de 200 GB para colaboración y de 1 TB para archivo de documento. El tamaño de base de datos de contenido incluye metadatos y blobs independientemente del lugar donde estén ubicados los blobs, y el uso de RBS no omite ni aumenta estos límites.

 

En las nuevas pautas para detalles de tamaño de base de datos de contenido compatible se describen pautas específicas para administradores de SharePoint a medida que crece el tamaño de datos. Si se sigue esta nueva orientación, SharePoint puede admitir hasta 4 TB de datos en todas las situaciones de uso y no tiene ningún límite de tamaño impuesto para situaciones de archivo de documento. Los detalles pueden consultarse en el documento de TechNet Administración de la capacidad de SharePoint Server 2010: las restricciones, los límites y los cambios principales del software son:

 

  1. Para una base de datos de contenido de SharePoint de 200 GB como máximo, no hay requisitos especiales y se incluye este límite para mantener la coherencia.
  2. Para una base de datos de contenido de SharePoint de 4 TB como máximo, debe planear además estos dos requisitos:
    • Requiere rendimiento de subsistema de disco de 0,25 IOPS por GB; se recomiendan 2 IOPS por GB para un rendimiento óptimo.
    • Requiere que el cliente planee una gran cantidad de disponibilidad, recuperación ante desastres, capacidad futura y pruebas de rendimiento.
    • Además debe revisar las consideraciones adicionales en el artículo de TechNet Restricciones y límites.
  3. Para una base de datos de contenido de SharePoint que supera los 4 TB, específicamente para una situación de archivo de documento, debe planear además lo siguiente:
    • Los sitios de SharePoint deben estar basados en plantillas de sitio de Centro de documentación o Centro de registros, y deben ser una situación de archivo en la que menos del 5% del contenido se lea activamente cada mes y menos del 1% del contenido se escriba activamente.
    • No use alertas, flujos de trabajo, reparaciones de vínculos o seguridad a nivel de elemento en ningún objeto de SharePoint de la base de datos de contenido. Nota: las bases de datos de contenido de archivo de documento pueden ser el destinatario de documentos como consecuencia del flujo de trabajo Enrutamiento de contenido.
  4. Otros cambios de límites específicos que se realizan al mismo tiempo:
    • Un nuevo límite de 60 millones de elementos en cualquier base de datos de contenido de SharePoint
    • Se eliminó el límite específico de 5 TB por instancia de SQL Server. En cambio, debe trabajar con un profesional de SQL Server para planear el almacenamiento de base de datos.

Consulte el documento del artículo completo de TechNet Administración de la capacidad de SharePoint Server 2010: restricciones y límites del software. También publicamos una guía sobre la escalabilidad de SharePoint 2010 aquí: https://go.microsoft.com/fwlink/?LinkId=223599. En breve publicaremos un informe de prueba a gran escala que admite estos nuevos límites de tamaño.

El valor de Almacenamiento remoto de blobs con SharePoint

RBS (Almacenamiento remoto de blobs) es un conjunto de API estandarizadas que permiten el almacenamiento o la recuperación de blobs (datos de objetos binarios grandes) fuera de su base de datos SQL principal donde se desea un almacenamiento de blobs dedicado. RBS usa un modelo de proveedor para conectarse a cualquier almacenamiento de blobs dedicado que implementa las API de RBS. RBS se introdujo en SharePoint 2010 y pueden instalarse proveedores en SharePoint y usarse para almacenar blobs. Los documentos en bibliotecas de documentos de SharePoint son blobs y con RBS pueden almacenarse de forma remota en la base de datos de SQL Server. Esto generalmente significa que los blobs se almacenan en el mismo equipo que SQL Server aunque pueden estar en un equipo de SQL Server conectado en red.

 

Más arriba aparecen dos diagramas que muestran arquitecturas comunes para SharePoint con RBS. En ambos se muestra el proveedor de cliente de RBS que se instala en el front-end web de SharePoint. En el diagrama de la izquierda se muestra la implementación genérica de RBS donde un tercero implementó RBS para obtener acceso a su almacenamiento. En el diagrama de la derecha se muestra el proveedor de secuencia de archivo RBS para SQL Server que almacena blobs en el sistema de archivos de Windows.

 

Almacenar blobs fuera de la base de datos de SQL Server puede tener ciertas ventajas como:

· RBS permite la ejecución de SharePoint Foundation 2010 en SQL Express para almacenar más datos que el límite de 4 GB de SQL Express. En SQL Express 2008 R2, este límite se aumentó a 10 GB.

· Algunas operaciones pueden estar optimizadas para el rendimiento con tamaños de blob medios de más de 1 Mb. Este resultado se obtiene de pruebas con el proveedor de RBS para SQL. Ref: https://msdn.microsoft.com/en-us/library/cc949109(SQL.100).aspx

· Podría haber optimizaciones de almacenamiento con ahorros potenciales de espacio en disco y coste de disco a partir de almacenamiento en niveles o copias de seguridad diferenciales.

· Completamos las pruebas con el proveedor de secuencia de archivo RBS para SQL que puede permitir almacenamiento conectado por iSCSI para usar RBS. El uso de iSCSI permite usar almacenamiento NAS de coste más bajo.

· Pueden desarrollarse otras optimizaciones de datos potenciales con ISV por medio del uso de API RBS y API de SharePoint públicas y compatibles.

Hay unas pocas cosas con las que se debe tener cuidado a la hora de implementar RBS:

· Se debe considerar cuidadosamente la estrategia de copia de seguridad. Tanto los metadatos de documento como los blobs de documento deben tener una copia de seguridad en el mismo momento exacto. Esto significa que cualquier solución de copia de seguridad de terceros debe poder restaurar la base de datos de SQL utilizada por SharePoint y los blobs utilizados por SharePoint como conjunto en el que no hay ninguna variación que tendría los blobs de referencia de base de datos que no están disponibles desde la misma copia de seguridad.

· Es muy probable que se use RBS para situaciones de archivo de documento en las que se escriban pero no se actualicen los documentos. Los blobs en RBS nunca se actualizan una vez que se escriben; en cambio se crea un nuevo blob para cualquier actualización. Los blobs son inmutables, los blobs antiguos son elementos innecesarios que se recopilan posteriormente. Puede leer más sobre colección de RBS innecesario en este artículo: https://technet.microsoft.com/en-us/library/ff628583.aspx

· Los proveedores de RBS deben devolver el primer byte de datos en una solicitud en 20 ms. Esto se aplica a todas las solicitudes entre SharePoint y la capa de almacenamiento del proveedor de RBS.

· La base de datos de SharePoint está pensada para que únicamente SharePoint pueda leer o escribir en ella. Los proveedores de RBS no tienen acceso independiente a los datos. Esto incluye acceso directo a blobs. Ref: https://support.microsoft.com/kb/841057/en-us

· El rendimiento puede ser menor para tamaños de blobs más pequeños cuando se usa RBS. Esto también se muestra en el artículo “Almacenamiento de flujo de archivo en SQL Server 2008” antes mencionado.

· Existen muchos proveedores de RBS disponibles, y los clientes deben evaluar su aptitud para las implementaciones.

Documentación adicional de Microsoft sobre RBS en SharePoint

 

Vínculos de RBS de documentación de TechNet:

· Planificación de RBS (SharePoint Server 2010) [https://technet.microsoft.com/en-us/library/ff628583.aspx]

· Información general sobre el almacenamiento remoto de blobs (SharePoint Server 2010) [https://technet.microsoft.com/en-us/library/ee748649.aspx]

· Mantenimiento del almacenamiento remoto de blobs (RBS) (SharePoint Server 2010) [https://technet.microsoft.com/en-us/library/ff943565.aspx]

Preguntas y respuestas

· P: ¿Por qué no pudieron proporcionar estos límites de datos incrementados cuando se lanzó SharePoint 2010?

· R: Obtuvimos más información sobre la forma en que los clientes implementan soluciones de archivo de documento en SharePoint durante los últimos 12 meses. Ahora, al proporcionar orientación específica sobre la escala de tamaño de datos y concentrar la compatibilidad en ellos, podemos tener un límite de tamaño de datos superior para SharePoint y evitar tener un límite de tamaño de datos para la situación de archivo de documento.

 

· P: ¿Cuál es el nuevo límite de tamaño de datos para archivos de documento en SharePoint?

· R: No hay un límite de tamaño de datos, pero deben seguirse los nuevos factores de orientación para crear sistemas a gran escala admisibles. Si los factores adicionales no se abordan como corresponde, se aplica el límite inferior de admisibilidad.

 

· P: ¿Qué sucede si realmente necesito más de 4 TB en un conjunto de servidores SharePoint y no es archivo de documento?

· R: Debe usar una topología de escalabilidad horizontal. Esto implica tener varias bases de datos de contenido en un solo conjunto de servidores y tener sitios dispersos entre ellos. El tamaño de cada base de datos puede alcanzar hasta 4 TB siguiendo la orientación.

 

· P: ¿Qué sucede si supuse incorrectamente que el límite de 200 GB podía evitarse al mover los blobs a un proveedor de almacenamiento remoto de blobs y reducir así la cantidad de datos de SQL Server almacenados para SharePoint?

· R: Le recomendamos que actualice a SharePoint 2010 SP1 y que siga la nueva orientación para el tamaño total que tiene. Consulte con la empresa a la que le compró el proveedor de RBS para asegurarse de que estén probados con SharePoint 2010 SP1. Si tiene una implementación que no entra en los límites nuevos y viejos, le recomendamos que se ponga en contacto con el soporte técnico de Microsoft y que solicite una revisión de soporte. Esta es una revisión de soporte técnico de pago y el ingeniero de soporte técnico podrá indicarle si su implementación actual está admitida o si se recomiendan cambios para reducir los datos por base de datos de contenido.

 

· P: Como se admite NAS, ¿el proveedor de secuencia de archivo RBS para SQL Server permite el uso de un recurso compartido de red para almacenar allí los blobs?

· R: No, NAS debe conectarse por medio de iSCSI y aparecer como unidad local en el equipo de SQL Server.

 

· P: ¿Se aplicará en el software el límite de tamaño de base de datos de contenido o el límite de 20mS de TTFB?

· R: No. Estos son límites de soporte que recomendamos a los clientes que no superen para lograr el mejor rendimiento y para obtener el mejor soporte de Microsoft. No son restricciones fijas que mida el software de SharePoint.

 

· P: ¿Dónde estaba detallado el límite anterior de 200 GB en TechNet?

· R: Aparecía en TechNet en la página Restricciones y límites de planificación de capacidad de SharePoint. Mientras que RBS y los blobs antes no se destacaban específicamente, el límite de 200 GB estaba indicado con claridad para una base de datos de contenido de SharePoint que incluye metadatos y blobs. Se actualizó este artículo para los nuevos límites y para mostrar RBS a fin de ser más explícito y evitar cualquier mala interpretación posterior.

 

· P: ¿Un archivo de documento grande puede tener varias colecciones de sitios de SharePoint?

· R: Sí. Pero nuestra recomendación es que si tiene una colección de sitios de más de 100 GB, debe ser la única colección de sitios en una base de datos de contenido.

 

· P: ¿Un archivo de documento grande puede tener varias bibliotecas de documento?

· R: Sí. Puede tener varias bibliotecas de documento con diferentes permisos establecidos.

 

· P: ¿Es necesario SharePoint 2010 SP1 para aprovechar estos nuevos límites de base de datos de contenido?

· R: No. Los límites se aplican a SharePoint 2010 independientemente de que esté aplicado el SP1. Sin embargo, debido a las mejoras en SharePoint 2010 SP1 le recomendamos enfáticamente que lo instale.

 

Esta entrada de blog es una traducción. Puede consultar el artículo original en Data Storage Changes for SharePoint 2010