Le hachage consiste à séparer, puis à reconstruire les éléments d’une base de données envoyés sur les réseaux. Il génère des codes plus courts que les données d’origine, ce qui facilite l’obtention des éléments.
Il joue également un rôle clé pour les collisions de données qui peuvent réduire la performance des requêtes. Des chercheurs du MIT ont récemment cherché si l’IA peut donner de meilleures fonctions de hachage. Ils ont trouvé une méthode pour accélérer la recherche de données dans d’énormes bases de données.
Cette nouvelle technique de hachage pourrait être appliquée dans de nombreux domaines. Elle serait particulièrement utile pour l’IA, l’infographie, la bio-informatique et les compilateurs.
Dans cet article :
Le modèle permet de réduire de moitié les collisions de données
Les fonctions de hachage standard sont très aléatoires. Il arrive que deux données aient la même valeur de hachage. En conséquence, des collisions se produisent quand un utilisateur recherche un élément. L’utilisateur peut aussi être redirigé vers plusieurs éléments ayant la même valeur de hachage. La recherche est de ce fait plus lente et moins efficace.
Le nouveau modèle de hachage basé sur l’IA peut trier les données de manière à éviter les collisions. Ces dernières sont réduites de moitié et les calculs sont nettement plus précis. Le modèle peut réduire de 30 à 15 % le taux de collisions entre les clés d’un ensemble de données. La durée d’exécution s’en trouve également réduite de 30 %.
Cette méthode pourrait par exemple améliorer le stockage et l’analyse d’ADN, des séquences d’acides aminés et d’autres données biologiques.
« Ce que nous avons découvert dans ce travail, c’est que dans certaines situations, nous pouvons trouver un meilleur compromis entre le calcul de la fonction de hachage et les collisions auxquelles nous serons confrontés. Nous pouvons augmenter un peu le temps de calcul de la fonction de hachage, mais en même temps, nous pouvons réduire les collisions de manière très significative dans certaines situations. »
Ibrahim Sabek, post-doctorant au sein du MIT Data Systems
VOIR AUSSI : Cette IA est capable de stocker beaucoup plus de souvenirs
L’IA pourrait encore améliorer la performance de traitement de données
Pour cette recherche, les scientifiques ont voulu concevoir des fonctions de hachage pour différents types de données. Par ailleurs, ils prévoient d’explorer les hachages appris pour les bases de données qui peuvent être ajoutés ou supprimés. Quand les données sont mises à jour, le modèle doit être actualisé tout en maintenant sa précision.
En étudiant les modèles appris, ils constatent que les sous-modèles ont le plus d’influence dans la réduction de la collision. Ils souhaitent à présent utiliser les modèles appris dans le but de créer des fonctions de hachage pour différentes formes de données.
« Nous voulons encourager la communauté à utiliser l’apprentissage automatique à l’intérieur de structures de données et d’opérations plus fondamentales. Toute structure de données de base nous offre la possibilité d’utiliser l’apprentissage automatique pour capturer les propriétés des données et obtenir de meilleures performances. Il y a encore beaucoup de choses à explorer. »
Les chercheurs
BuzzWebzine est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :