L'omniprésence d'Internet en Afrique a augmenté lentement mais régulièrement depuis le début de ce millénaire. Grâce à plusieurs organisations qui ont donné du temps et des ressources, il est aujourd'hui possible d'affirmer que les écosystèmes AS de plusieurs pays d'Afrique connaissent actuellement un stade précoce de l'ère du peering. Mais combien de cette connectivité d'appairage nouveau-né pouvons-nous révéler en utilisant les collecteurs de routes BGP disponibles publiquement? En analysant les données BGP disponibles avec les techniques existantes, nous avons constaté qu'une grande partie de cette connectivité manquait dans l'ensemble de données, principalement en raison du manque de sources de données dans la région. Dans la plupart des pays, cela pourrait théoriquement être résolu en introduisant pas plus de dix nouveaux AS partageant leurs informations de routage complètes aux collecteurs de routes.
L'écosystème Internet AS-level
Internet est composé d'un ensemble de réseaux hétérogènes et indépendants, chacun se faisant concurrence et coopérant au moyen du protocole BGP (Border Gateway Protocol) pour construire les routes qui achemineront le trafic réel. Cet écosystème peut être analysé à différents niveaux d'abstraction en fonction du type d'analyse à effectuer, par exemple systèmes autonomes (AS), IP / routeur, points de présence (PoP). Le niveau AS en particulier est utile pour analyser comment les différents acteurs composant Internet (c'est-à-dire les AS) interagissent entre eux - en termes de routage BGP - sans trop se concentrer sur les détails concernant la structure interne de chaque joueur. La connaissance complète du niveau AS d'une région donnée aiderait également les administrateurs réseau de cette même région à planifier à l'avance leur routage inter-domaine, introduisant ainsi la quantité appropriée de redondances dans leurs choix de fournisseur afin que les problèmes éventuels de la région Internet aurait un impact minimal sur les performances de leurs propres réseaux.
Le niveau Internet AS est généralement représenté sous forme de graphique où les nœuds sont des AS et les connexions sont des sessions BGP établies entre des AS. Deux AS qui décident d'établir une session BGP échangent essentiellement un ensemble d'informations d'accessibilité au réseau qui est utilisé pour acheminer une partie de leur trafic Internet entre eux. Le montant et la nature des informations d'accessibilité échangées dépendent totalement des accords économiques signés entre les deux AS, qui peuvent généralement être classés en fournisseur à client (p2c) ou en peer-to-peer (p2p). Dans le premier cas, le fournisseur annonce au client les itinéraires pour atteindre tous les réseaux Internet, tandis que le client annonce au fournisseur les itinéraires pour atteindre ses réseaux et ses réseaux clients (le cas échéant). Dans ce dernier, les deux AS échangent des routes pour atteindre leurs clients respectifs, généralement pour maintenir le trafic local local et pour réduire les coûts de transit. La principale source de données pour analyser Internet au niveau de l'abstraction AS est les données BGP collectées et fournies par des organisations qui gèrent des collecteurs d'itinéraires, comme le Centre de coordination des réseaux Réseaux IP Européens (RIPE NCC) avec le Routing Information Service (RIS) et de Université de l'Oregon couplé à Vues de l'itinéraire projet et l'Institut d'informatique et de télématique du Conseil national italien de la recherche (IIT-CNR) avec le Isolaire projet. Un collecteur de routes est un serveur exécutant un démon de routage BGP qui collecte et stocke les informations de routage au format MRT (Multi-Threaded Routing Toolkit), et n'annonce aucune information d'accessibilité à ses voisins BGP. Chaque AS est libre d'adhérer et de partager ses informations de routage avec le public, contribuant à améliorer la quantité - et donc la qualité - des données BGP disponibles à des fins de recherche. L'information fondamentale trouvée dans les données BGP collectées pour analyser l'écosystème de niveau AS est l'attribut AS PATH, qui peut être utilisé pour déduire à la fois les nœuds (ASes) et les connexions (adjacences AS) de la topologie de niveau AS.
Collecteur de routes BGP
Géolocalisation
Grâce aux bases de données accessibles au public, il est possible de déduire la géolocalisation de l'AS en géolocalisant chacun des sous-réseaux annoncés par l'AS grâce à la disponibilité de bases de données mappant les adresses IP dans les pays. Cette technique permet de déduire des topologies régionales en considérant simplement que chaque contiguïté AS peut être géolocalisée si les deux AS annoncent (au moins) un sous-réseau dans le même pays. Au final, l'ensemble des AS géolocalisés dans un pays / continent donné contiendra à la fois des AS appartenant à des organisations locales et strictement liés au territoire où ils opèrent - ci-après des AS locaux - et des AS appartenant à des organisations internationales qui opèrent dans le même territoire à des fins de commercialisation - ci-après AS internationaux. Nous considérerons ci-après qu'un AS donné est local s'il y a une entrée dans le registre AFRINIC liée à cet AS.
Un premier regard sur l'écosystème africain au niveau de l'AS
L'Afrique est un continent extrêmement hétérogène en termes de langue, de culture et d'économie, et cette hétérogénéité peut également être reconnue également dans son écosystème au niveau AS. Dans le même continent, coexistent des pays dotés d'une bonne connectivité et d'une bonne pénétration d'Internet - avec un autre ensemble de pays où l'infrastructure Internet doit encore faire partie intégrante de leurs économies. Sur 1084 AS locaux, l'Afrique du Sud se taille la part du lion avec 322 AS, suivie du Nigéria (145 AS), du Kenya (79 AS), de la Tanzanie (63 AS) et du Ghana (56 AS). L'une des caractéristiques les plus impressionnantes que l'on puisse remarquer en un coup d'œil est la faible omniprésence des IPv6 malgré les efforts déployés par plusieurs organisations dans les sessions de formation et IPv6 conférences ciblées. Chaque AS local annonce sur Internet au moins un IPv4 réseau alors que seulement 203 d’entre eux en annoncent (au moins) un IPv6 réseau. Ce dernier ensemble de SA est principalement réparti entre l'Afrique du Sud (47%), la Tanzanie (13%), le Kenya (10%), Maurice (9%) et le Nigéria (6%). Un autre aspect intéressant est que seuls 90 AS locaux (environ 8%) sont situés dans plus d'un seul pays, ce qui montre à quel point le trafic transitant entre les pays voisins dépend toujours des fournisseurs internationaux.
Comme pour le reste de l'écosystème Internet, l'écosystème de peering en Afrique est à un stade très précoce de développement. Il y a quelques années, la majeure partie du trafic local était acheminée via l'Europe et l'Amérique du Nord, ce qui entraînait des problèmes de performances en raison de latences élevées. Les choses ont commencé à changer au cours de la dernière décennie, lorsque des initiatives telles que le système d'échange Internet en Afrique (AXIS) a entraîné une augmentation spectaculaire du nombre d'IXP dans la région. Aujourd'hui en Afrique, on trouve 37 IXP actifs situés dans 34 villes dans 28 pays (source: L'Association Africaine IXP). En parcourant les sites Web de chaque IXP, il est facile de voir que la plupart d'entre eux ont actuellement moins de 20 AS connectés, à l'exception notable de NAPAfrica en Afrique du Sud (273 AS à Johannesburg, Le Cap et Durban), JINX en Afrique du Sud ( 82 AS à Johannesburg), IXPN au Nigeria (54 AS à Lagos, Abuja et Port Harcourt), KIXP au Kenya (36 AS entre Nairobi et Mombasa), TIX en Tanzanie (36 AS entre Dar es Salaam et Arusha) et UIXP en Ouganda (26 AS à Kampala). La présence d'un IXP aussi bondé que NAPAfrica en Afrique du Sud souligne encore plus à quel point l'écosystème Internet de l'Afrique du Sud est totalement différent du reste de l'Afrique, ressemblant à l'écosystème d'un pays européen.
Données sur l'écosystème au niveau de l'Afrique
Sur l'exhaustivité du graphique de niveau AS africain
Les données BGP sont connues pour être loin d'être totalement représentatives de l'écosystème Internet AS-level. Premièrement, le nombre d'AS participant à un projet de collecte de routes est extrêmement faible par rapport à la taille totale des AS composant Internet. Au cours de notre analyse, seuls 525 AS partageaient leurs informations de routage avec Isolaire, RIS et/ou Vues de l'itinéraire, alors que le nombre total d'AS acheminés sur Internet était de 59,005 257. Deuxièmement, les collecteurs de routes ne reçoivent pas les informations de routage complètes de tous leurs départs. Plusieurs collecteurs sont placés sur des IXP à travers le monde et de nombreux feeders leur appliquent les mêmes politiques d'exportation que celles appliquées aux autres participants IXP. En d'autres termes, ils n'annoncent aux collecteurs d'itinéraire que leur cône client, ce qui offre une vision extrêmement limitée d'Internet. Lors de notre analyse, environ la moitié des mangeoires présentaient ce type de comportement, avec seulement XNUMX AS partageant IPv4 l'espace et 200 AS partageant un IPv6 espace proche d'une table de routage complète. Les feeders annonçant leur table de routage complète aux collecteurs de routage seront ci-après dénommés feeders complets. Enfin, les données BGP sont connues pour manquer une grande partie de la connectivité p2p établie aux IXP ou via le peering privé. Cela est principalement dû à l'emplacement des départs complets dans le graphique AS et à la présence de politiques d'exportation BGP et de relations économiques entre les AS. Compte tenu des relations économiques standard établies entre les AS, un AS annonce à l'autre AS ses informations de routage complètes - contenant les routes apprises de ses pairs, fournisseurs et clients - mais uniquement s'il s'agit d'un fournisseur de l'autre partie. Par conséquent, un collecteur de routes ne peut voir les routes établies via les IXP et le peering privé d'un AS X donné que s'il existe une chaîne de relations de transit du collecteur de routes vers X. Ce concept a été formalisé comme suit: distance p2c, et il a été utilisé pour quantifier le nombre d'AS pour lesquels il est possible de découvrir la connectivité complète étant donné un ensemble de départs complets. L'incomplétude du graphique qui en résulte doit être prise sérieusement en considération lors de l'analyse d'Internet au niveau de l'abstraction AS car elle peut facilement conduire à des conclusions erronées, en particulier lors de l'analyse des propriétés du graphique.
Un collecteur de routes R connecté au sommet de la hiérarchie Internet ne pourra pas révéler la connectivité d'appairage établie dans la partie inférieure de la hiérarchie
La situation de la couverture en Afrique n'est pas très différente du reste du monde. Actuellement, trois collecteurs d’itinéraire en Afrique sont physiquement déployés KIXP au Kenya (Vues de l'itinéraire), JINX en Afrique du sud (Vues de l'itinéraire) et NAPAfrique en Afrique du Sud (RIS). Ces collecteurs reçoivent des données de 69 feeders, 63 situés en Afrique du Sud, 4 au Kenya et 2 à Maurice. Un chargeur supplémentaire d'Afrique du Sud est connecté à Isolaire via multihop BGP. La grande majorité des départs n'annonce qu'une petite partie de l'espace IP, beaucoup plus petite que l'espace de table de routage complet respectif qui se compose aujourd'hui d'environ 600k (v4) et 40k (v6) routes. Sur 69 départs, seulement 13 peuvent être considérés comme des départs complets v4 et seulement 9 départs complets v6. Tous sont situés en Afrique du Sud, à l'exception d'un feeders complets v4 et un v6 situés sur l'île Maurice. Ainsi, il est presque simple de comprendre que la connectivité de peering établie dans les 30 IXP en Afrique situés ni en Afrique du Sud ni à Maurice est actuellement complètement cachée aux collecteurs de routes BGP, tandis que le petit nombre de départs complets disponibles en Afrique du Sud et à Maurice le font pas leur permettre de révéler une grande partie de la connectivité de peering dans leurs pays. En tenant compte de la métrique de distance p2c, il est possible de prétendre que les départs complets actuels permettent de révéler la connectivité complète de 29 transit IPv4 AS sur 129 (22.5%) et 5 sur 28 en transit IPv6 ASes (17.9%) en Afrique du Sud alors qu'il est possible de découvrir la connectivité complète de 6 transit IPv4 AS sur 31 (19.4%) et aucun IPv6 transit AS as plus de 9 à Maurice. Dans le reste des pays africains, les seuls AS couverts sont les AS internationaux, qui sont couverts par des départs en dehors de l'Afrique.
Pour mieux comprendre à quelle distance le système de mesure BGP actuel est de l'état idéal, où la connectivité p2p entière de chaque pays est révélable et potentiellement visible, nous avons appliqué le problème de couverture minimale définie (MSC) décrit par Gregori et coll. à chaque topologie régionale collectée à partir des données BGP. Dans chaque scénario régional, chaque AS disponible est considéré comme un alimentateur potentiel avec son propre ensemble de couverture - c'est-à-dire l'ensemble des AS de transit ayant une distance p2c finie par rapport à l'AS - et l'objectif du problème est de trouver le nombre minimum d'AS dont les ensembles de couverture couvrent l'ensemble des AS de transit dans cette région. La figure ci-dessous montre la fonction de distribution cumulative complémentaire (CCDF) du nombre de mangeoires nécessaires dans chaque pays africain. Notez que le scénario v6 est calculé sur la base uniquement de 12 pays où les AS étaient connectés les uns aux autres. Le scénario de l'Afrique du Sud est le plus reconnaissable sur les deux images. Étant donné la grande quantité d'AS dans les scénarios v4 et v6, un nombre assez important de départs est requis pour obtenir la couverture complète des AS de transit. Dans tous les autres cas cependant, le nombre de départs requis est assez faible, souvent inférieur à 10 en v4 ou v6. Cela signifie qu'avec un effort considérablement réduit - 10 sessions BGP complètes à établir - il pourrait être possible de révéler la connectivité de peering complète de 90% des pays africains.
CCDF de la solution cardinalité du problème MSC dans chaque pays africain
Conclusion
L'Afrique montre dans son écosystème de niveau AS la même hétérogénéité qu'elle montre en termes de culture, d'économie et de développement. L'écosystème de niveau AS le plus développé se trouve en Afrique du Sud, où l'écosystème de peering est extrêmement similaire à la plupart des pays européens, comme le prouve le nombre d'IXP disponibles. Ensuite, il y a un petit ensemble de pays progressistes (par exemple l'Égypte, le Kenya, le Nigéria et la Tanzanie) où l'omniprésence d'Internet est en constante augmentation et est de plus en plus une partie importante de leur économie. Enfin, il existe un grand nombre de pays où Internet est à un stade très précoce de développement. Dans cet écosystème, nous avons constaté que les collecteurs de routes BGP ne parviennent presque pas à révéler la connectivité d'appairage établie entre les AS, affectant ainsi toute analyse graphique possible concernant l'écosystème africain. Malgré cela, nous avons constaté qu'en théorie, il pourrait être possible de résoudre cette situation dans la plupart des pays africains en introduisant seulement dix nouveaux distributeurs complets.
Fin des notes de bas de page
Les analyses effectuées dans cette entrée de blog sont calculées à partir des données BGP collectées par chaque collecteur de routes mis à disposition par Isolaire, RIS et Vues de l'itinéraire le 8 août 2017. La géolocalisation est réalisée à l'aide du Base de données des pays GeoLite2 mis à la disposition du public par Maxmind, tandis que les relations économiques sont inférées à l'aide de l'algorithme décrit par Gregori et coll.
Bio: Alessandro Improta a obtenu son BSc et MSc en génie informatique de l'Université de Pise, Italie, en 2006 et 2009, respectivement. Il a ensuite obtenu son doctorat en ingénierie de l'information à l'Université de Pise, en 2013. Depuis 2009, Alessandro occupe un poste de chercheur à l'Institut d'informatique et de télématique (IIT) du Conseil national de la recherche italien (CNR) à Pise. Ses intérêts de recherche incluent la mesure et l'analyse du niveau AS Internet et la découverte des caractéristiques des chemins Internet.