#################################################### ## 20/11/2006 - Gil Voge [gvoge][@][ac-grenoble][fr] #################################################### ## Charge la librairie seqinr library (seqinr) ## Montre la liste des banques de donnes accessibles sur http://pbil.univ-lyon1.fr choosebank() ## Charge les parametres de connexion pour GenBank dans myGenBank puis affiche ces parametres myGenBank <- choosebank("genbank") myGenBank ## Charge dans myList, les noms des sequences de l'espece Gallus gallus et qui sont des sequences codantes et qui ne sont pas partielles query(listname = "Chicken", query = "sp=Gallus gallus et t=cds et no k=partial") names(Chicken) Chicken$nelem Chicken$req[[1]] ## Récupération des noms et des séquences grâce à la fonction sapply() qui permet d'appliquer la même instruction à tous les éléments d'une liste. ## Attention opérations chronophages : de plusieurs dizaines de minutes à plus d'une heure myProtName <- sapply(Chicken$req, getName) myProtSeq <- sapply(Chicken$req, getTrans) myProtpI <- sapply(myProtSeq, computePI) ## Cloture de la connexion à la banque closebank("genbank") ## Histogramme de la distribution des pI des séquences du protéome de Gallus gallus hist(myProtpI, ylim=c(0, 0.3), col="lightgrey", main="Distribution des pI\n dans le proteome de Gallus gallus (6165 sequences)", freq=FALSE, las=1, border="lightgrey", xlab="pI", ylab="Fréquences") lines(density(myProtpI), col="red")