Le changement d’infrastructure de l’IA : redéfinir la fourniture d’applications
Il est devenu évident que toute cette perturbation de l’IA est l’une des ceux perturbations. Vous savez, du genre qui ne change pas seulement notre façon de faire les choses et les applications que nous utilisons pour le faire, comme la pandémie. C’est le type de technologie qui modifie les fondements mêmes de la technologie utilisée pour fournir et sécuriser de nouveaux types d’applications et de technologies. Ce qu’il faut, c’est un changement d’infrastructure d’IA
Pourquoi? La façon dont nous construisions des solutions, choisissions des centres de données et architecturions des réseaux est née d’hypothèses clés concernant l’infrastructure informatique et la fourniture d’applications qui ne sont plus vraies aujourd’hui.
-
Optimisation du débit: On supposait que les systèmes étaient optimisés pour le débit plutôt que pour la latence ou la gigue, en mettant l’accent sur des taux de transfert de données élevés pour des cas d’utilisation tels que le streaming vidéo, les véhicules autonomes et les jeux en temps réel plutôt que sur les performances en temps réel.
-
Clients homogènes et latence cohérente: Les clients étaient supposés être homogènes, avec des attentes de latence cohérentes et des menaces de sécurité limitées, généralement dues à l’hacktivisme, au crime organisé ou à la balle dans les États-nations, plutôt qu’à des méthodes d’attaque plus sophistiquées ou variées.
-
Infrastructure informatique simplifiée: L’environnement informatique était supposé simple, avec des exigences de livraison d’applications et de sécurité prévisibles, où l’adoption de parcs informatiques hybrides et la complexité des charges de travail d’IA générative ont créé la nécessité de prendre en charge des architectures et des modèles de déploiement hétérogènes.
Ces hypothèses étaient basées sur un paysage plus simple et plus prévisible. Cependant, avec l’essor de l’IA générative, l’adoption généralisée de environnements informatiques hybrides (couvrant le cloud public, sur site et en périphérie) et la complexité croissante de la fourniture et de la sécurité des applications, ces hypothèses ne sont plus vraies.
Mettre en œuvre une infrastructure d’IA pour suivre le rythme des changements d’applications
Aujourd’hui, nous avons des clients traditionnels, des clients mobiles, des appareils IoT, des agents d’IA, des applications et des scripts qui agissent tous comme des clients légitimes pour une application ou une API. Les entreprises citent « trop d’outils et d’API » comme leur principal défi lors de la gestion de parcs multicloud, ce qui complique les efforts visant à évoluer vers des opérations plus autonomes (AIOps). Et comme les entrées multimodales et non déterministes deviennent la norme grâce à l’IA générative, la fourniture de réseaux et d’applications doit désormais équilibrer débit, latence et instabilité en temps réel, souvent sans la visibilité nécessaire pour le faire efficacement.
Il suffit de dire que nous essayons de fournir et de sécuriser une nouvelle génération d’applications avec la dernière génération de technologie.
Cela signifie qu’il est temps d’envisager sérieusement les changements nécessaires à la fourniture d’applications pour répondre à une nouvelle architecture d’applications, aux nouvelles attentes en matière de performances et à la nécessité de fonctionner de manière transparente dans tous les environnements.
Pour la fourniture d’applications, cela signifie prendre en charge la mise en réseau multi-cloud, permettant une gestion en temps réel observabilité en générant des données télémétriques sur des mesures critiques telles que la latence, le débit et les performances spécifiques à l’IA, et en élargissant les capacités de livraison et de sécurité pour non seulement prendre en charge les applications traditionnelles, mais également gérer les besoins en données à grande échelle de l’IA générative, tels que les ensembles de données massifs requis pour le modèle. formation et inférence.
Reconnaître l’impact profond de l’IA en tant que perturbateur des infrastructures n’est pas une mince affaire. Il est clair que le paysage de la fourniture d’applications et de l’infrastructure est en train de changer fondamentalement. Les hypothèses qui guidaient autrefois la manière dont nous construisions, déployions et sécurisons les applications ne suffisent plus face à l’IA générative, aux parcs informatiques hybrides et aux exigences complexes des entreprises modernes. Pour garder une longueur d’avance, les entreprises doivent adopter de nouveaux paradigmes : donner la priorité à la flexibilité multi-cloud, observabilité en temps réelet l’évolutivité requise pour gérer les grandes quantités de données et les charges de travail dynamiques exigées par l’IA.
Un dernier mot sur la nécessité d’une nouvelle infrastructure d’IA
L’essor de l’IA générative n’est pas seulement un changement technologique ; c’est un catalyseur pour repenser la façon dont nous abordons l’architecture, la sécurité et les performances des applications. Tout comme l’avènement du cloud a redéfini l’infrastructure informatique il y a dix ans, l’IA nous pousse désormais à repenser l’ensemble de notre approche de la fourniture d’applications, de la périphérie du réseau au centre de données.
Dans ce nouveau monde, le succès dépendra de la capacité à s’adapter rapidement, à innover sans relâche et à garantir que l’infrastructure puisse évoluer et fonctionner d’une manière qui était autrefois inimaginable. Les organisations qui parviendront à surmonter cette perturbation seront celles qui ouvriront la voie à la prochaine ère technologique. Il est temps d’agir maintenant, car l’avenir est déjà là.