New Relic, la plateforme d’observabilité cloud la plus importante et la plus complète du marché, conçue pour créer des logiciels de très haute qualité, annonce la disponibilité d’une version améliorée de New Relic AI, une suite d’outils AIOps destinée aux équipes d’astreinte DevOps, de Site Reliability Engineering (SRE) et des centres d’exploitation réseau (NOC) responsables de la gestion des infrastructures modernes. New Relic AI comprend des technologies avancées d’intelligence appliquée (AI) et de machine learning (ML) pour aider les clients à détecter, diagnostiquer et à résoudre plus vite les incidents, tout en améliorant la gestion des incidents de manière continue.
Les équipes DevOps et SRE subissent une pression accrue pour atteindre les objectifs des niveaux de services, livrer des logiciels sans erreurs et corriger rapidement les pannes avant que leurs clients ne s’en aperçoivent. De plus en plus souvent, les équipes se retrouvent noyées sous les alertes envoyées par des outils variés, ce qui rend encore plus difficiles la détection, le diagnostic et la résolution des problèmes potentiels. New Relic AI a été conçu pour donner aux équipes les informations et l’automatisation nécessaires à la gestion des incidents, ainsi que des workflows qui leur permettent de trouver plus vite les causes profondes des problèmes.
« New Relic a pour objectif de contribuer à réduire le travail et l’anxiété des équipes exploitant des systèmes modernes. Nous sommes fiers d’annoncer que nos clients participant à notre programme d’accès anticipé ont déclaré avoir constaté une réduction automatique du bruit des alertes de 50%, et certains jusqu’à 80%, en quelques jours », explique Guy Fighel, GVP et Product GM chez New Relic. « New Relic AI est la seule solution bénéficiant des automatismes, de l’intelligence et de l’architecture évolutive nécessaires pour offrir une véritable observabilité et des enseignements précis, indispensables aux entreprises modernes et complexes. Nous continuons à repousser les limites afin de valoriser les équipes DevOps et SRE, tout en travaillant constamment à l’amélioration de notre plateforme. »
New Relic AI est une solution AIOps globale qui est non seulement capable de comprendre les alertes historiques, mais aussi d’appliquer le machine learning et l’IA pour réduire significativement le bruit des alertes, enrichir les incidents avec du contexte et fournir en temps réel des informations et l’automatisation aux équipes. Fortement intégré à la plateforme d’observabilité New Relic One, New Relic AI est une solution ouverte de corrélation et d’intelligence dédiée aux incidents, indépendante de la source et des données. Avec son accès unique à NRDB, une base de données de télémétrie unifiée, New Relic AI alimente des modèles de machine learning et fournit un flux de réponses intelligent et riche en contexte, tirant parti de fonctionnalités clés, notamment :
Détection proactive et plus rapide des problèmes : évalue en permanence les données de télémétrie pour informer les clients des anomalies au sein de leurs outils de collaboration. Cela leur permet de prendre des actions rapides pour éviter les problèmes plus importants avant qu’ils n’impactent l’expérience client. New Relic AI permet aux clients d’ingérer, d’analyser et d’agir sur de multiples types de données, notamment les alertes, les logs, les indicateurs, les événements de déploiement, etc. Les équipes bénéficient ainsi de meilleures informations contextuelles sur les incidents et leur impact sur l’environnement global, afin de diagnostiquer et hiérarchiser plus vite les problèmes.
L’intelligence des incidents réduit le bruit des alertes et permet un diagnostic et une réponse plus rapides : New Relic AI s’intègre complètement à de multiples sources de données afin de regrouper les alertes et incidents associés, et inclut des corrélations à base d’AI/ML pour aider les clients à hiérarchiser les alertes et se concentrer sur les incidents les plus graves. Le bruit des alertes est automatiquement atténué par la corrélation des alertes, des événements et des incidents associés, tout en supprimant les alertes de priorité basse. Les incidents corrélés sont enrichis de contexte, hiérarchisés automatiquement en fonction de signaux critiques (erreurs, saturation, trafic, latence), et identifient les composants associés affectés et suggèrent des réponses, afin d’aider les équipes d’astreinte à comprendre les causes profondes et à réagir plus vite. De plus, cela libère les utilisateurs d’un processus d’apprentissage exigeant, d’implémentations chronophages et d’intégrations complexes généralement associées aux autres outils AIOps. En bénéficiant de la corrélation des incidents, les clients du programme d’accès anticipé ont constaté des réductions automatiques du bruit des alertes de 50 %.
Intégration poussée avec des workflows de gestion des incidents existants : New Relic AI s’intègre à Slack, PagerDuty, ServiceNow, OpsGenie, VictorOps et d’autres outils pour s’adapter aux workflows de gestion des incidents déjà installés. Les incidents enrichis par du contexte pertinent, des instructions et des suggestions contextuelles alimentées par le machine learning sont partagés automatiquement dans les workflows collaboratifs existants, en évitant de devoir passer d’un outil à un autre en période de crise. Les clients disposent d’une vue en direct sur les données ingérées, un résumé intelligent de chaque incident et la capacité à affiner les corrélations avec les commentaires des utilisateurs.
Selon Gartner : « L’AIOps sera capable de détecter des schémas qu’un humain ne peut que difficilement voir, notamment ceux qui révèlent une relation de cause à effet. À partir de cette détermination de causalité, des modèles pourront être créés pour savoir quels indicateurs IT doivent être cartographiés selon les objectifs d’entreprise. L’observation de ces indicateurs dans le temps permet d’affiner chaque modèle et de veiller à les maintenir à jour pour que toutes les hypothèses produites restent justes. Par le biais de son utilisation des algorithmes de machine learning, l’AIOps propose une méthode mathématique spécifique pour révéler les connexions cachées, les causes et les opportunités de données qui rendent possible ce processus. »