Combigo
folder

400-500 millions de documents
stockés sur Public Cloud Databases For MongoDB d’OVHcloud

magnifying glass

De 3 000 à 4 000 requêtes
traitées par seconde

Clock

0 indisponibilité
depuis la mise en production de la base de données MongoDB

Le contexte

Il existe déjà de nombreux sites de réservation de billets d’avion, train et bus mais la startup Combigo mise sur un positionnement original : combiner les moyens de transport afin de dénicher des prix imbattables et une empreinte écologique la plus faible possible. « La valeur ajoutée de Combigo, c’est de savoir combiner les différents moyens de déplacement pour proposer les meilleures offres à nos clients », explique Vincent El Khatib, Cofondateur & CTO chez combigo.com.

Leurs algorithmes vont trouver les combinaisons les moins chères en faisant des étapes pour profiter des meilleures opportunités de tarif. Les résultats de cette approche sont impressionnants : 83 € et 216 kg de CO2 pour un Paris Lisbonne, 91 € pour un Paris /Athènes, en combinant le train, l’avion et l’autocar, Combigo est imbattable.

La startup annonce des prix réduits de 70% et une diminution jusqu’à 96% des émissions de CO2 pour un trajet train + train Paris Berlin par exemple. Ainsi, Combigo optimise tous les trajets pour les voyageurs acceptant de faire une ou plusieurs correspondances.

Actuellement, la France et l’Europe représentent de l’ordre de 90% des ventes de billets, mais la startup compte déjà des clients aux Etats-Unis et dans le reste du monde, et ce taux ne fera que croître lorsque les mesures de limitations des voyages seront levées.

Le défi

Pour déterminer le trajet optimal en matière de prix, d’empreinte écologique ou encore le plus rapide, la startup travaille depuis maintenant plus de 2 ans sur des algorithmes d’optimisation extrêmement complexes. En effet, si le temps de trajet n’est pas le critère principal mais le prix, l’algorithme peut proposer des prix imbattables en multipliant les correspondances…

Comme pour toute entreprise dont l’activité s’appuie sur des algorithmes, la donnée constitue la matière première de Combigo. Enormément de données : le service compile déjà les données de toutes les lignes et de tous les tarifs de 4 000 compagnies aériennes, opérateurs ferroviaires et d’autocars. Cette activité amène la startup à manipuler énormément de données ; nous sommes notamment connectés à Kayak et Liligo, ainsi qu’à plusieurs autres comparateurs. La fréquence de mise à jour de nos données peut atteindre de 30 à 40 fois par seconde pour certaines sources.

La startup, qui n’est encore qu’en phase de démarrage, doit déjà stocker entre 400 millions et 500 millions de documents dans sa base de données principale. Et si l’audience est amenée à croître rapidement en fonction du succès du service, la base de données doit déjà traiter de 3 000 à 4 000 requêtes par seconde.

La solution

Dès l’origine du projet, le CTO a fait le choix de la base de données MongoDB pour faire face à ce déluge de données. Vincent El Khatib est resté fidèle à ce choix de MongoDB- la base de données étant simplement complétée sur la plateforme de production par la solution Redis, qui assure une fonction de caching sur les résultats délivrés par MongoDB.

Combigo diagram

 

Les données manipulées par Combigo sont certes structurées, mais elles sont accessibles sous forme de documents précise le directeur technique. En outre, il estime qu’une base relationnelle classique est bien plus difficile à faire évoluer. Selon lui, une base orientée document est la plus adaptée pour charger simplement tous les fichiers, mais aussi modéliser tous les schémas, et créer le nouvel index.

Utilisateur de longue date des services d’OVHcloud, Vincent El Khatib a fait naturellement le choix du cloud provider Européen de confiance pour passer à son offre MongoDB cloud. En février 2021, alors que l’activité commerciale commence à décoller, Combigo fait le choix d’intégrer le Startup Program, qui lui permet de bénéficier de crédits d’utilisation des services. « Ces crédits nous ont permis d’assurer notre montée en charge initiale puis, notre activité prenant plus d’ampleur, OVHcloud nous a proposé de rejoindre son programme Scale. Nous avons pu disposer de plus de crédits, mais aussi avoir la possibilité de participer à la phase Beta de l’offre Public Cloud Databases for MongoDB. »

Face aux autres offres MongoDB cloud, le responsable privilégie OVHcloud afin que la base de données soit au plus près de son infrastructure de calcul car les algorithmes mis en œuvre réalisent énormément d’accès aux données. « Une proximité réseau entre nos instances de calcul et la base de données nous permet d’obtenir les meilleures performances possibles. D’autre part, nous avons la garantie que tous les backups sont sauvegardés dans un autre datacenter pour des raisons de sécurité » précise le CTO.

« La donnée est absolument critique dans notre activité car sans donnée, nous ne pouvons plus délivrer notre service auprès des clients. Le backup automatique délivré par OVHcloud dans son offre Public Cloud Databases For MongoDB nous apporte de la confiance et nous permet de ne pas consacrer du temps à configurer les sauvegardes. »
Vincent El Khatib, Cofondateur & CTO chez combigo.com

Le résultat

Avec l’offre Public Cloud Databases For MongoDB d’OVHcloud, les développeurs de Combigo peuvent créer une base MongoDB en un clic, avec un cluster prêt à l’emploi et surtout le backup automatisé des données.  « La donnée est absolument critique dans notre activité car sans cette donnée, nous ne pouvons plus délivrer notre service auprès des clients. Ce backup automatique nous apporte de la confiance et nous permet de ne pas consacrer du temps à configurer les sauvegardes. »

De même, ne se pose plus la problématique des montées de version de MongoDB car OVHcloud assure la migration : les Ops de Combigo se libèrent des lourdeurs et de la montée de version chronophages mises à jour.

Le service Combigo évolue encore à grande vitesse et s’appuie sur les infrastructures et la solution PaaS MongoDB pour faciliter ses itérations. « Grâce à Public Cloud Databases for MongoDB, nous avons pu rapidement monter de nouvelles bases afin de réaliser des tests, vérifier comment réagit la plateforme à une nouvelle configuration, à une nouvelle version de nos algorithmes. Cela nous permet de comparer les performances des deux configurations et avancer ainsi par itérations. Le fait de disposer de crédits et de pouvoir créer des bases de données MongoDB rapidement et nous permet d’aller très vite dans notre développement. »

En termes de disponibilité, le responsable explique n’avoir jamais rencontré d’indisponibilité depuis qu’il a mis en production ses bases Public Cloud Databases For MongoDB, y compris lors de la phase beta, qui s’est achevée en octobre 2021.

Parmi les prochaines évolutions inscrites à la roadmap de la startup, celle-ci va intégrer les données issues d’un grand GDS (Global Distribution Systems) du secteur aérien. Cela va représenter un nouveau bond en avant en matière de volumétrie. De même, la startup n’a de cesse que de faire évoluer ses algorithmes. Celle-ci exploite plusieurs modèles en parallèle afin d’évaluer le pricing des trajets.

Bientôt, l’IA permettra à Combigo d’affiner encore ses prévisions de prix en fonction des tarifs passés. « Nous savons que nous pourrons compter sur OVHcloud pour que l’infrastructure monte en charge lorsque nous lancerons ces nouveaux algorithmes. »

De 15 à 20 millions de documents stockés à son lancement, la startup en est à fin 2021 à plus de 400 millions. L’activité commerciale atteint désormais 1 million de GMV (Gross Merchandise Volume) et les fondateurs s’attendent à ce que l’activité explose dans les prochains mois. Néanmoins ceux-ci restent sereins quant à la capacité de leur infrastructure à faire face. C’est l’une des vertus des offres Databases as a Service managées d’OVHcloud.