Aplim - Caso de éxito
Aplim - coste dividido por dos

Coste de la infraestructura inicial
dividido por 2

Aplim - infraestructura multiplicada por dos

Tamaño de la infraestructura
multiplicado por 10

Aplim - uso multiplicado por cinco

Uso
multiplicado por 5

El contexto

Aplim es una empresa del grupo Aplon especializada en el diseño de programas de gestión para centros escolares, desde escuelas infantiles hasta centros de educación superior. Sus clientes son, principalmente, escuelas privadas francesas.

Aplim es líder en su sector. ¿El secreto? Ofrecer soluciones totalmente personalizables y configurables, capaces de responder a todas las necesidades: inscripciones, vida escolar (asistencia, cantina, autorización de salidas), agenda, espacios de trabajo, calificaciones, mensajería, contabilidad, facturación, etc.

La solución EcoleDirecte, basada en el programa Charlemagne, se lanzó en el año 2000 y a día de hoy, veinte años después, es utilizada por más de 1,5 millones de alumnos, 3 millones de padres, 300 000 docentes y 80 000 funcionarios administrativos.

La crisis sanitaria de la COVID-19 y el confinamiento decretado en Francia el 17 de marzo de 2020 hicieron que la educación a distancia, aunque ya generalizada en este país, se convirtiese de la noche a la mañana en la norma imperante. Desde entonces, el sitio web «ecoledirect.com» ha recibido más solicitudes que nunca. Y es que, para garantizar la continuidad de las clases, los centros educativos franceses se han visto obligados a adaptar su funcionamiento. Por su parte, el sitio web gestionado por Aplim tuvo que hacer frente a grandes picos de tráfico. Afortunadamente, la integración previa de nuevos servicios y la automatización de la infraestructura preexistente permitieron gestionar con éxito esta avalancha de conexiones simultáneas. Esta medida preventiva resultó decisiva para la empresa y sus usuarios.

El desafío

Aplim trata un gran número de datos personales relativos a la educación de los alumnos franceses. La protección de esta información era una cuestión crucial, por lo que la empresa necesitaba alojar estos datos en Francia. Gracias a los datacenters de OVHcloud en diferentes ciudades francesas como Roubaix, Gravelines y Estrasburgo, la empresa pudo cumplir con este requisito.

Para nosotros era fundamental que nuestros datos estuvieran alojados en Francia.


Steve Giraud, responsable de desarrollo de Aplim

Por otro lado, la empresa necesitaba poder escalar la infraestructura, pero controlando los costes asociados. Tras un encuentro en el OVHcloud Summit de 2019, la empresa decidió probar los servicios de Public Cloud. A principios de 2020, Aplim comenzó a implementar esta solución en una parte de su infraestructura, con instancias de Public Cloud en lugar del alojamiento Hosted Private Cloud. El equipo técnico inició entonces una nueva fase de industrialización de los despliegues, ya que las operaciones en Public Cloud resultan más sencillas, gracias a la gran reactividad en materia de entrega de recursos y a la disponibilidad de las API estándar de OpenStack. La prueba de concepto (PoC) resultó positiva, por lo que la empresa decidió adoptar el cloud híbrido, integrando los servicios de cloud público en la infraestructura existente.

Nuestra infraestructura necesitaba una solución que pudiéramos controlar fácilmente.


Steve Giraud, responsable de desarrollo de Aplim

Esta solución permitió que Aplim aprovechase al máximo la plataforma inicial desplegada en OVHcloud, basada en la solución Hosted Private Cloud. De este modo, el equipo técnico pudo disfrutar de la flexibilidad y la solidez de la suite de software de VMware, al tiempo que reforzó su capacidad para absorber la carga.

Para satisfacer las nuevas exigencias de optimización de la infraestructura de EcoleDirecte, la empresa necesitaba encontrar una solución que permitiese gestionar los picos de carga asociados, entre otros, a la fluctuación de la actividad y al aumento exponencial de los espacios de almacenamiento y de backup.

Estas necesidades se hacen patentes en dos situaciones concretas:

  • Picos de tráfico puntuales y previsibles: Aplim sabe que numerosos estudiantes se conectan de forma masiva a la plataforma los lunes, martes y miércoles, entre las 16:00 y las 22:00 horas. Este ciclo regular requiere una serie de recursos adaptados para que los servicios puedan responder con la misma rapidez que durante los períodos menos solicitados.
     
  • Picos de tráfico imprevisibles, más intensos y duraderos: incluso antes de la crisis de la COVID-19, Aplim era consciente de la necesidad de poder aumentar la carga de forma rápida y eficaz, siempre que fuera necesario. Y es que gestionar los picos previsibles es sencillo, pero un aumento repentino de la carga puede suponer todo un reto.

¿Qué es un pico de tráfico?

 

Consiste en un aumento repentino del número de peticiones enviadas y/o recibidas por un servidor en un corto período de tiempo. Sin una infraestructura adecuada, un pico de tráfico puede provocar una ralentización del servicio e, incluso, hacer que este deje de estar disponible para los usuarios.

La solución

La arquitectura inicial desplegada en Hosted Private Cloud aloja todos los servicios: el sitio web público, una parte de los servidores API, las bases de datos y las copias de seguridad.

Una de las ventajas de esta solución es que permite hacer un vertical scalling o escalado vertical cuando una base de datos requiere más recursos, por ejemplo. Además, también es posible escalar los recursos del cluster VMware, alojado en los datacenters de Roubaix, añadiendo hosts o datastores.

Las necesidades de almacenamiento de Aplim se dispararon durante el confinamiento por la COVID-19. Para dar respuesta a estas nuevas exigencias, la empresa añadió diez nuevos datastores SSD de 3 TB a su infraestructura Hosted Private Cloud.

Para poder escalar necesitábamos mucha flexibilidad, una API para que nuestros devops pudieran gestionar los recursos y desplegar estos servicios en varios datacenters. Las soluciones vRack y Public Cloud de OVHcloud nos ofrecían todo esto.


Steve Giraud, responsable de desarrollo de Aplim

Sin embargo, como ya hemos explicado, Aplim baraja dos escenarios diferentes y estos son difícilmente compatibles con un tipo de infraestructura basada únicamente en Hosted Private Cloud. Para ofrecer una respuesta adecuada a estos picos de carga imprevisibles, de mayor intensidad y duración, la empresa realizó una PoC utilizando instancias de Public Cloud.

La solución Public Cloud también resulta eficaz durante los picos de tráfico momentáneos y predecibles, con una duración y una variación conocidas, ya que permite programar e industrializar el arranque de las instancias, bajo demanda, en franjas horarias determinadas.

Gracias a esta facilidad para crear y eliminar recursos, las instancias solo se facturan 72 horas al mes en lugar de 720. Esta relación 10:1 permite ofrecer un servicio rápido y fiable durante los picos de carga y, al mismo tiempo, rentabilizar los costes. Los servidores API, que utilizan IIS, realizan un horizontal scalling y se multiplican gracias a la automatización implementada por Aplim. Este funcionamiento está especialmente adaptado a las capas aplicativas stateless, como en el caso de los servidores API, y permite optimizar el gasto. El resultado de la PoC fue, obviamente, positivo.

Así pues, cuando el Gobierno francés anunció la continuación de las clases durante el confinamiento de marzo de 2020, Aplim pudo hacer frente al aumento en el número de visitas diarias. Y es que el sitio web pasó de registrar un millón de conexiones puntuales y previsibles al día a recibir cinco millones de conexiones diarias.

Podemos crear instancias automáticamente cada tarde para gestionar picos de carga regulares, pero también de forma manual en circunstancias excepcionales. ¡Y todo esto en cuestión de minutos!


Steve Giraud, responsable de desarrollo de Aplim

Gracias a esta experiencia, Aplim pudo reaccionar de forma inmediata frente al aumento de estas conexiones masivas. Y es que, aunque los servidores API y su treintena de instancias proporcionaban tiempos de respuesta suficientes, fue necesario añadir 300 instancias en pocos días para soportar este aumento de la carga.

Todo el trabajo realizado por los equipos para una industrialización máxima de los despliegues dio sus frutos en este contexto excepcional. En lugar de iniciar 30 máquinas, como en un período normal, se realizó esta operación 300 veces durante los primeros picos de tráfico registrados a mediados de marzo de 2020.

Gracias a la reactividad de los equipos de OVHcloud en datacenter y a la disponibilidad del hardware, la empresa pudo entregar 4800 vCores y 18 TB de RAM en solo unos días. Estas 300 instancias, conectadas al resto de la arquitectura mediante la red privada vRack entre datacenters, junto con la industrialización a través de los servicios de Public Cloud, permitieron que la empresa absorbiese la carga durante este período excepcional.
Aplim infrastructure

El resultado

Pese a que el tamaño de la infraestructura se ha multiplicado por diez y su uso, por cinco, la adopción y el uso de Public Cloud antes de la crisis sanitaria permitió reducir a la mitad el precio de la plataforma inicial. Este enfoque favoreció una optimización máxima de los costes.

Gracias a la industrialización aportada por la solución Hosted Private Cloud de Aplim y la posterior ampliación con Public Cloud, la infraestructura pudo cumplir con todas sus funciones sin ningún contratiempo. Además, durante la pandemia se desplegó un equipo específico de desarrolladores para crear herramientas de enseñanza a distancia. Los comentarios de los clientes y usuarios han sido muy positivos, y algunos centros públicos incluso se han puesto en contacto con la empresa.

Esta experiencia nos permite extraer diversas buenas prácticas. En primer lugar, la industrialización de cada acción en la infraestructura: todo puede automatizarse por API. En segundo lugar, el balanceo de la carga, que resulta una condición indispensable a la hora de gestionar un scalling horizontal. Por último, la alta disponibilidad de los servicios, gestionada mediante mecanismos de auto-healing y dependiente de la capa de software desplegada. Si esta alta disponibilidad de los servicios es stateless, como los servidores API, un simple mecanismo de kill/create permite responder fácilmente a todo tipo de situaciones. Si esta capa de software es statefull, un mecanismo de cluster gestionará el auto-healing. Teniendo en cuenta todos estos principios, las funcionalidades de Public Cloud permiten que cualquier empresa gestione tanto los picos de carga previstos y temporales como aquellos imprevisibles y más intensos.

La solución EcoleDirecte, en constante evolución, tiene previsto implementar nuevas funcionalidades, como la integración de Object Storage para resolver los problemas relacionados con el almacenamiento de documentos.