J'ai un grand vecteur avec des mots (plusieurs millier) et j'aimerais compter combien de fois revient chaque mot puis balancer tout ça dans un vecteur de chiffres avec les mots en titre simplement la procédure crée avec un programme qui s'appelle R est très lente qqn aurait-t-il une autre solution.
Merci d'avance
function(mots,nom_site,min=1,fichier=TRUE)
{
mots<-unlist(mots)
noms<-NULL
tab<-NULL
mots_temp<-NULL
# Passe tout les mots en revu
while(length (mots)>0)
{
# Sort un tableau où l’on met un 1 si le mot correspond au mot en question et un 0 s’il est différent
k<-as.numeric (mots==mots[1])
if (sum(k)>=min)
{
# Somme les 1 pour obtenir le nombre d’itération
tab<-c(tab,sum(k))
noms<-c(noms,mots[1])
}
#Enlève les mots identiques au mot en question
mots<-mots[mots!]]
}
tab<-as.table(tab)
dimnames(tab)[[1]]<-noms
matrice<-as.matrix(tab)
#Enregistrement dans un fichier texte
if (fichier==TRUE){
connect <- file(paste("EtuWeb/Temp/tableaux/",nom_site,".txt",sep=""), "wt")
write.csv(t(tab),file=connect)
close(connect)
}