Nous venons de vivre plus de 24 heures… plutôt mouvementées ! Tous les services et sites de Humanoid (FrAndroid, appXoid, LesArdoises, Android Bundle, FraWin, Mobs, etc.) ont été inaccessibles pendant plusieurs heures. Malgré une architecture avec trois serveurs physiques et une dizaine de machines virtuelles prévus pour faire face à plusieurs éventualités, nous n’avions pas imaginé un scénario comme celui-ci. En tout cas, nous voici de retour ! 

Dans un premier temps, nous voulions nous excuser pour la gêne occasionnée. Nous avons fait tout notre possible pour remettre en place les serveurs. A l’heure actuelle, plus de 90% des services ont été remis en marche. Néanmoins, nous voudrions vous rassurer : nous n’avons pas été hackés. Nous avons déjà reçu de nombreuses attaques dans le passé, notre structure est désormais suffisamment sécurisée.

En réalité, nous avons modifié toute notre architecture avec plusieurs machines virtuelles (openvz) pour pouvoir réagir plus rapidement en cas de problème, et surtout pour gagner en efficacité. Nous avons donc plusieurs serveurs virtuels sur une machine physique.

Les principales raisons de partitionner une machine physique en plusieurs serveurs dédiés virtuels sont d’améliorer la sécurité : si une des applications ou un projet, par exemple FrAndroid, est corrompue ou pose problème, les autres services se trouvant dans des serveurs dédiés virtuels différents continueront à fonctionner normalement.

Sauf… la configuration actuelle fonctionne sur plusieurs serveurs, les base de données des services et le forum sont sur un serveur physique, tandis que les fichiers des autres projets sont sur un serveur physique différent, enfin un troisième serveur nous permet de réaliser des sauvegardes journalières. Cette configuration nécessite donc des échanges continus entre les différentes machines physiques. Malheureusement, une mauvaise configuration des masques de sous réseau a entraîné des remontées de données « étranges » auprès de notre hébergeur. Pour protéger son réseau, l’hébergeur a donc bloqué nos serveurs pour cause de « hack » et nous a retiré l’accès à deux serveurs physiques. Enfin, une corruption des sauvegardes les plus récentes nous a empêché  de « remonter » nos machines virtuelles rapidement.

Heureusement, après tous ces déboires, nous avons eu plusieurs bonnes nouvelles. Notre hébergeur a reconnu que ce qu’il avait pris du hack n’était en fait qu’une mauvaise configuration. Nous avons donc pu accéder à nos serveurs, pour ensuite tout vérifier, tout re-tester et tout relancer.

Nous voilà de retour avec un quatrième physique en prime ! Le cauchemar est terminé et cela nous a permis d’améliorer encore et encore notre architecture serveur. J’espère que nos déboires serviront à d’autres. Nous voulions, en tout cas, vous remercier pour les centaines d’encouragements ! Cette mésaventure nous a encore plus motivé !

Bon week-end à tous !

Toute l’équipe Humanoid ! 😉