Puisque seules les valeurs avec [a][b][c]...[w][x][y][z] sont importantes, nous ne stockons que l'indice lui-même, pas la valeur 1 qui est à peu près partout - toujours le même aucun moyen de le hacher. Notant que la malédiction de la dimensionnalité est présente, suggérons d'aller avec un outil établi NIST ou Boost, lisez au moins les sources pour éviter les erreurs inutiles.
Si le travail doit capturer les distributions de dépendance temporelle et les tendances paramétriques d'ensembles de données inconnus, alors une carte ou un arbre B avec une racine à valeur unique n'est probablement pas pratique. Nous ne pouvons stocker que les indices eux-mêmes, hachés si l'ordre (sensibilité pour la présentation) peut être subordonné à la réduction du domaine temporel au moment de l'exécution, pour toutes les valeurs 1. Étant donné que les valeurs non nulles autres que un sont peu nombreuses, un candidat évident pour celles-ci est la structure de données que vous pouvez trouver facilement et comprendre. Si l'ensemble de données est vraiment de la taille d'un vaste univers, je suggère une sorte de fenêtre coulissante qui gère vous-même le fichier / disque / persistant-io, en déplaçant des parties des données dans la portée selon les besoins. (écrire du code que vous pouvez comprendre) Si vous vous engagez à fournir une solution réelle à un groupe de travail, ne pas le faire vous laisse à la merci des systèmes d'exploitation grand public qui ont pour seul objectif de vous prendre votre déjeuner.< /p>