RECHERCHER :
COMMUNAUTE MP
Identifiez vous ...
Devenir Membre
J'ai oublié mon MDP
DOMAINE MP
Bavardages
Langages Généraux
Langages Web
Langages DotNet
Autres langages
Dev. Jeux Video
Sécurité
Sys. Exploitation
Graphismes
Logiciels
Réseaux
Bases de données
Méthodologies
Emplois High-tech
Aide juridique
Articles juridiques
FORUM
Index des forums
Ajouter un sujet
Rechercher sujet
Contact Responsable
Devenir modérateur
CHAT MP IRC
Votre pseudo ...
Srv: irc.moteurprog.com
Chan: #MoteurProg
PARTICIPER
Plus de 3500 emplois.
Rechercher un job
Déposez votre CV
Emplois High-tech

Visiteur MP

 Parser le code HTML

Forum : VB .NET
Sous Catégorie : Aucune
Type du sujet : Sujet Normale
FAQ : FAQ VB .NET

SUIVI DES SUJETS PAR MAIL

SUIVI PAR MAIL INACTIF

RESOLUTION DU SUJET SUJET NON RESOLU
BLOQUAGE DU SUJET SUJET ACTIF
APPARTENANCE A LA FAQ N'APPARTIENT PAS A LA FAQ


PAGE : [1]

POSTER UN NOUVEAU SUJET REPONDRE A CE SUJET

FORUM VB .NET

PREMIERE PAGE

PAGE PRECEDENTE

Page précedente

Page suivante

PAGE SUIVANTE

DERNIERE PAGE
satte
Nouveau membre
Inscrit : 21/01/2008
Messages : 3
Message
#148037
Posté le 21/01/08 à 01:21
Salut tout le monde,
Je suis entrain de travailler sur une application pour mon projet qui consiste à ouvrir un document html en utilisant le moteur de IE "MSHTML" et de filtrer tous les URL.

CODE :
Dim Lien As HTMLLinkElement
Dim Document1 As New mshtml.HTMLDocument
Dim Document2 As New mshtml.HTMLDocument
Dim i As Integer

Document1 = Document2.createDocumentFromUrl("URL", vbNullString)

While Document1.readyState <> "complete"
System.Windows.Forms.Application.DoEvents()
End While

For Each Lien In Document1.links
ListBox1.Items.Add(Document2.links.item(i))
Next

Mais cela ne fonctionne pas, ca me donne "Tentative de lecture ou d'écriture de mémoire protégée. Cela indique souvent qu'une autre mémoire est endommagée."
Est ce que quelqu'un aurait une idée pour résoudre le problème ou y a-t-il une autre façon de faire peut être.
Merci

HAUT DE PAGE

PROFIL MEMBRE LUI ECRIRE 

Publicité
Inscrit : X
Messages : X
Message
#Aucun

HAUT DE PAGE

  

Czayfaboo
Co-Administrateur
Superviseur :
- Langages Dot.
Modérateur :
- CSharp (C#)
Chef de projet(s) :
- ID3.NET Library
- MoteurProg Work.

Avatar de Czayfaboo
Inscrit : 05/01/2005
Messages : 2883
Message
#148047
Posté le 21/01/08 à 13:15
Salut, cette ligne m'a l'air louche :
satte dit :
Document1 = Document2.createDocumentFromUrl("URL", vbNullString)

notamment le URL entre guillemets... mais je ne connais pas la classe que tu utilises pour parser ton html.

Sinon, c'est pas très dur de parser toutes les url d'une page html. Je te conseille même de le faire toi même, çà ira plus vite. Voici le mode d'emploi :
  • Télécharger la page HTML avec la classeWebClient.
  • Ouvrir le fichier et tout stocker dans un type string
  • Utiliser les regex et parser les chaines de la forme : <a href="url". On récupère alors facilement les chaines url.


Dis moi ce que t'en penses et si çà t'avances...
__________________________
Sujet résolu ? Pensez à mettre le tag Image
Un problème en C# ? Vérifiez celui-ci n'est pas déjà résolu dans la FAQ et que le sujet n'est pas traité parmis les tutoriaux ou les articles avant de poster dans le forum C#.

HAUT DE PAGE

PROFIL MEMBRE LUI ECRIRE 

pistache
Superviseur :
- CSharp (C#)
Modérateur :
- VB .NET
- XAML
Chef de projet(s) :
- Image Data base
- Titan

Avatar de pistache
Inscrit : 22/02/2005
Messages : 1302
Message
#148224
Posté le 24/01/08 à 10:42
Salut, satte

Pourquoi utilise tu 2 documents ?

Notamment :


For Each Lien In Document1.linksListBox1.Items.Add(Document2.links.item(i))Next

Pourquoi utilise tu document2 : les liens sont dans document1, non ?

Et sinon la méthode de Czayfaboo est bonne, mais il va falloir utiliser les regex, car les attributs HTML ne sont malheureusement pas toujours dans l'ordre.

Voilà...
__________________________
Prière de ne pas oublier le magnifique tag Image (résolu) si votre sujet l'est !

Pistaaaaaaaaaaache

HAUT DE PAGE

PROFIL MEMBRE LUI ECRIRE 
POSTER UN NOUVEAU SUJET REPONDRE A CE SUJET

PREMIERE PAGE

PAGE PRECEDENTE Page précédente

Page suivante

PAGE SUIVANTE DERNIERE PAGE

FORUM VB .NET



    PAGE : [1]



.: Site Web développé par Julien Pichot et l'équipe MPWG avec www.evolvia-web.com :.