SRE (Site Reliability Engineering) book.

Amalfitano
3 min readMar 17, 2018

--

Este libro es una recopilación de ensayos de ingenieros responsables de la estabilidad y operación de las aplicaciones e infraestructura en Google. Los temas son variados, desde balanceo de peticiones hasta el comité encargado de evaluar y aprobar los pases a producción. Una particularidad destacable es que cada ensayo muestra pros y contras de las decisiones que se han tomado, las razones de su elección y las mejoras que sufrieron en el camino.

Entre sus páginas se delinea una disciplina reciente, los ingenieros que las llevan a cabo son llamados SRE (Site Reliability Engineer), algo así como los Jedi de Google. Estos equipos de trabajo se conformar de personas con diferentes habilidades y con un tronco común. Es decir, todos ellos provienen de ramas diferentes de especialización, sin embargo, todos y cada uno de ello son capaces de tirar código y pensar en soluciones complejas. Imagino que este tipo de personas son las que leen todo el tiempo, se aburren de las tareas cotidianas y carentes de desarrollo personal, reflexionan, critican y sacan sus propias conclusiones sin pretender ser adalides de las verdades impolutas. Sus funciones se insertan en todo el proceso de concepción, diseño, desarrollo, implementación, operación, automatización y monitoreo, entre otros; jugando un papel clave en la toma de decisiones, contención de problemas y medición de riesgos.

Las dimensiones de Google los llevó a repensar la construcción de aplicaciones y sus implicaciones subyacentes. Realizar soluciones basadas en software no solo involucra elegir el lenguaje de programación en boga, el framework con mayor seguridad y la base de datos con mejor rendimiento; tiene que ver mucho con procesos de control de calidad, contención de daños, mejora continua, tratados sobre operación y soporte, capacitación, seres humanos, despliegues, automatización, resolución de problemas entre departamentos, monitoreo, análisis, responsabilidad, conformación de equipos, mejores prácticas, planeación; y el más importante de todos, el constante escrutinio de su operación para mejorar todos y cada uno de sus procedimientos. Es impresionante leer que una de las empresas más grandes del mundo se mueve y adapta con una velocidad que, incluso las empresas pequeñas envidian. Desde mi punto de vista, el basamento para lograrlo es aceptar que siempre hay errores y que lo más importante es detectarlos, contenerlos, aprenderlos y evitarlos en medida de lo posible, siempre con la premisa de interacción entre máquinas y hombre.

Google diseña con el error en mente y con la necesidad de escalar continuamente cada componente que interviene en sus soluciones, asimismo, evita acoplar estos crecimientos con incrementar en la misma proporción sus equipos de trabajo. En otras palabras, elimina la complejidad innecesaria en beneficio de su operación y de sus costos. Sin duda, labor hercúlea que solo las mentes más pragmáticas y agudas son capaces de realizar.

¿Quién lo debe leer?

La lectura de esta antología de ensayos sin duda mejora la concepción de cualquier profesional cercano a las IT, sin importar su rol dentro de la organización. Es ideal para directivos, socios, gerentes, jefes, desarrolladores, QA, analistas, PM’s, operaciones, gestión de cambios, monitoreo, etc. Me atrevo a decir que lo más importante es entender la filosofía en la cual se mueven estos equipos, la cual se puede portar a todas las empresas de cualquier país, aunque no siempre el personal esté preparado. Supongo que el inicio es que todo asuman el reto de leer este libro con la mente dispuesta.

Lo pueden encontrar online o comprarlo en papel con su distribuidor de libros informáticos favorito. En lo personal, lo adquirí en papel, es imprescindible en mi biblioteca.

--

--

Amalfitano
Amalfitano

No responses yet