El MasterServer HBase

A partir de un análisis de HBase (base de datos Hadoop) arquitectura describiendo RegionServers lugar del MasterServer puede sorprender. El termino RegionServer parecería implicar que depende (y es secundaria a) la MasterServer y que, por lo tanto usted debe discutir el MasterServer primero. Como dice la vieja canción, sin embargo, " no es necesariamente lo que ".

Los RegionServers no dependen del MasterServer para ciertas funciones, pero no en el sentido de una relación maestro-esclavo para el almacenamiento y recuperación de datos. En la esquina superior izquierda de la figura, observe que los clientes no apuntan a la MasterServer, pero apuntan en cambio a la agrupación Zookeeper y RegionServers.

imagen0.jpg

El MasterServer no está en la ruta de acceso para el almacenamiento de datos y el acceso - ese es el trabajo de la agrupación Zookeeper y los RegionServers. Echa un vistazo a las principales funciones de la MasterServer, que es también un proceso de software (o demonio) como los RegionServers. El MasterServer está ahí para

  • Monitorear los RegionServers del clúster HBase: El MasterServer mantiene una lista de RegionServers activos del clúster HBase.

  • Manejar las operaciones de metadatos: Cuando se crea una tabla o sus atributos se alteran (ajuste de compresión, configuración de la caché, control de versiones, y más) el MasterServer se encarga de la operación y las tiendas de los metadatos necesarios.


  • Asignar regiones: El MasterServer asigna regiones para RegionServers.

  • Administrar RegionServer conmutación por error: Como con cualquier grupo de distribución, que espera que los fallos de nodo no se produzcan y que planea para ellos de todos modos. Cuando los servidores región fallan, Zookeeper notifica al MasterServer para que las operaciones de conmutación por error y restauración se pueden iniciar.

  • Supervisar el equilibrio de carga de las regiones a través de todos RegionServers disponibles: Usted puede recordar que las tablas se componen de regiones que se distribuyen de manera uniforme en todos los RegionServers disponibles. Esta es la obra de la rosca equilibrador (o faena, si lo prefiere) que la MasterServer activa periódicamente.

  • Administrar (y limpiar) tablas de catálogo: Dos tablas de catálogo de claves son utilizados por el sistema HBase para ayudar a un cliente a encontrar un par de valores clave en particular en el sistema.

    El MasterServer proporciona una gestión de estas tablas críticos en nombre de todo el sistema HBase.

  • Desactive la WAL: El MasterServer interactúa con la conmutación por error WAL durante RegionServer y limpia periódicamente los registros.


  • Proporcionar un marco coprocesador para la observación de operaciones de maestro: Aquí hay otro nuevo plazo para su crecimiento glosario HBase. Coprocesadores ejecutar en el contexto de la MasterServer o RegionServers. Por ejemplo, un coprocesador observador MasterServer le permite cambiar o ampliar la funcionalidad normal del servidor cuando las operaciones, tales como la creación de tablas o una tabla eliminación se llevan a cabo. A menudo coprocesadores se utilizan para gestionar índices de tabla para aplicaciones HBase avanzadas.

Un coprocesador, que se ejecuta en el contexto de la MasterServer y o RegionServer (o ambos) se puede utilizar para mejorar la seguridad, crear índices secundarios, y más. Puede encontrar más información acerca de coprocesadores en un blog de la comunidad HBase.

Al igual que con todas las tecnologías de Hadoop de código abierto, las operaciones MasterServer probable cambiar con el tiempo como la comunidad de ingenieros trabajan en innovaciones diseñadas para mejorar HBase. Al escribir estas líneas, sin embargo, ahora tiene una lista bastante completa de la que sirve de referencia de alto nivel para la MasterServer.

Por último, un punto más importante sobre la calidad del HBase MasterServer: No puede y debe ser un MasterServer respaldo en cualquier grupo HBase. Es necesario que haya un solo MasterServer activa en un momento dado, por lo que el MasterServer copia de seguridad es para los propósitos de conmutación por error.

Usted puede recordar que el MasterServer no está en la ruta de acceso a los datos para los clientes HBase. Sin embargo, también se puede recordar que la MasterServer es responsable de acciones como la conmutación por error RegionServer y balanceo de carga. La buena noticia es que los clientes pueden seguir para consultar el clúster HBase si el maestro va hacia abajo, pero para las operaciones normales de racimo, el maestro no deben permanecer abajo durante cualquier periodo de tiempo.