J'ai fait une petite appli qui recherche certains mots dans une page web...
Pour recherchez un mot, je mappe le fichier en memoire et je fait une recherche toute simple (CMP, CMP, CMP, CMP, ... En gros :)
Vous connaissez d'autres methode de recherche ?
Je ne vous demande pas de code, juste une idée pour ameliorer mon code ;)
dans la liste des possibles:cmps d/w/d -> repxx (DWord, avec quelques précautions, est relativement rapide)et bien-sûr scas b/w/d (même remarque que précédement)
;-------------------------------------------
Oui, c'est un peu ce que je fait...
Et je n'oublie pas le piege (Typique à Intel) quand je recherche sur un Dword
(Erreur frequente chez les novices)
Dans 50 ans, on aura droit à un processeur 128 bits et on pourra mettre une chaine de caratere directement dans un registre pour comparaison immediate.... Quel pieds :)
En attendant, on cherche une aiguille dans une botte de foin ;)
Betov répondra mais, pour ma part je préciserais, que si ta liste est triée, si la longueur du mot est > à 1 DWord... la méthode de recherche peut-être bien évidement simplifiée. Mais, dans ton cas, c'est un flux de vocables qui se suivent sans relations apparement (?).
Ceci dit, il existe des comparaisons sur des valeurs supérieures à DWord avec MMX...
C'est en fait tout bete, je cherche toute les URL d'une page web...
Ma methode de comparaison et de recherche basique fonctionne, mais je me demandais si il n'y avait pas d'autres facon de chercher... Pour apprendre et pourquoi pas pour optimiser...
Il me semble que quel que soit la méthode de construction du site tout termine en HTML sur la bécane client. Le plus simple est de chercher l'entête et de stocker dans ta table jusqu'à la balise de fin... non ?
__________________________ www.rosasm.org/ www.quanta-it.com/easbell/RosAsmForum
Il me semble que quel que soit la méthode de construction du site tout termine en HTML sur la bécane client. Le plus simple est de chercher l'entête et de stocker dans ta table jusqu'à la balise de fin... non ?
-----------------------------------------------------------------
Reponse un peu tardive de ma part (désolé)
Oui ,c'est exactement ce que j'ai fait et mon prog est fini (enfin presque, mon spider a deja avalé automatiquement plus de 1 million d'url et je compte bien lui faire avalé toutes les url du web)
J'attends juste la sortie du pentium 3000, parceque sur mon pc 2mgz, ca rame grave avec 1 million d'url à rechercher dans ma base de données et à afficher :)
Le big probleme dans le scan d'une page html, c'est que pas grand monde code proprement une simple page web.
J'ai été obligé de creer plusieurs routines rien que pour la verification de mes captures d'url surtout à cause des caractere (balise) de fin justement...