Structure des données - Recherche d'interpolation

La recherche par interpolation est une variante améliorée de la recherche binaire. Cet algorithme de recherche fonctionne sur la position de palpage de la valeur requise. Pour que cet algorithme fonctionne correctement, la collecte de données doit être triée et répartie de manière égale.

La recherche binaire présente un énorme avantage de complexité temporelle par rapport à la recherche linéaire. La recherche linéaire a une complexité dans le pire des cas de Ο (n) alors que la recherche binaire a Ο (log n).

Il y a des cas où l'emplacement des données cibles peut être connu à l'avance. Par exemple, dans le cas d'un annuaire téléphonique, si nous voulons rechercher le numéro de téléphone de Morphius. Ici, la recherche linéaire et même la recherche binaire sembleront lentes car nous pouvons directement sauter dans l'espace mémoire où les noms commençant par «M» sont stockés.

Positionnement dans la recherche binaire

Dans la recherche binaire, si les données souhaitées ne sont pas trouvées, le reste de la liste est divisé en deux parties, inférieure et supérieure. La recherche est effectuée dans l'un ou l'autre.

Même lorsque les données sont triées, la recherche binaire n'en profite pas pour sonder la position des données souhaitées.

Sondage de position dans la recherche d'interpolation

La recherche par interpolation trouve un élément particulier en calculant la position de la sonde. Initialement, la position de la sonde est la position de l'élément le plus au milieu de la collection.

Si une correspondance se produit, l'index de l'élément est renvoyé. Pour diviser la liste en deux parties, nous utilisons la méthode suivante -

mid = Lo + ((Hi - Lo) / (A[Hi] - A[Lo])) * (X - A[Lo])

where −
   A    = list
   Lo   = Lowest index of the list
   Hi   = Highest index of the list
   A[n] = Value stored at index n in the list

Si l'élément du milieu est supérieur à l'élément, la position de la sonde est à nouveau calculée dans le sous-tableau à droite de l'élément du milieu. Sinon, l'élément est recherché dans le sous-tableau à gauche de l'élément du milieu. Ce processus se poursuit également sur le sous-tableau jusqu'à ce que la taille du sous-tableau soit réduite à zéro.

La complexité d'exécution de l'algorithme de recherche par interpolation est Ο(log (log n)) par rapport à Ο(log n) de BST dans des situations favorables.

Algorithme

Comme il s'agit d'une improvisation de l'algorithme BST existant, nous mentionnons les étapes pour rechercher l'index de valeur de données `` cible '', en utilisant le palpage de position -

Step 1 − Start searching data from middle of the list.
Step 2 − If it is a match, return the index of the item, and exit.
Step 3 − If it is not a match, probe position.
Step 4 − Divide the list using probing formula and find the new midle.
Step 5 − If data is greater than middle, search in higher sub-list.
Step 6 − If data is smaller than middle, search in lower sub-list.
Step 7 − Repeat until match.

Pseudocode

A → Array list
N → Size of A
X → Target Value

Procedure Interpolation_Search()

   Set Lo  →  0
   Set Mid → -1
   Set Hi  →  N-1

   While X does not match
   
      if Lo equals to Hi OR A[Lo] equals to A[Hi]
         EXIT: Failure, Target not found
      end if
      
      Set Mid = Lo + ((Hi - Lo) / (A[Hi] - A[Lo])) * (X - A[Lo]) 

      if A[Mid] = X
         EXIT: Success, Target found at Mid
      else 
         if A[Mid] < X
            Set Lo to Mid+1
         else if A[Mid] > X
            Set Hi to Mid-1
         end if
      end if
   End While

End Procedure

Pour connaître la mise en œuvre de la recherche d'interpolation dans le langage de programmation C, cliquez ici .