(Gil Voge, Lycée Louise Michel, Grenoble)

R est un environnement de manipulation, d'analyse et de représentation graphique des données [1].

Si les fonctions de base ne suffisent pas, de nombreux modules (packages) additionnels [2] permettent d'étendre les fonctions de R dans différents domaines.

Quelques exemples : ajustement des données expérimentales à des modèles non linéaires, manipulation et analyse de séquences d'acides nucléiques et d'acides aminés, maîtrise statistique de la qualité, etc.

R est un logiciel interactif [3] mais il peut aussi être programmé pour automatiser des tâches répétitives et/ou fastidieuses.

Gage de souplesse, il peut aussi être utilisé en combinaison avec des langages de programmation tels que Perl, Python ou Java.

Libre (sous licence GNU/GPL), multiplateforme R est disponible gratuitement sur le site du Comprehensive R Archive Network (CRAN) [4].


[1] Page d'accueil du projet R.

[2] Liste des packages (modules) additionnels.

[3] Les instructions sont saisies dans une console et exécutées au fur et à mesure de leur introduction dans la console (mode interactif).

[4] Télécharger et installer R.

1 - Cinétiques enzymatiques michaéliennes avec R

Présentation d’un script R permettant de déterminer les valeurs de KM et Vmax de cinétiques enzymatiques selon trois méthodes différentes :

  • Lineaver-Burk,
  • Eisenthal-Cornish-Bowden,
  • Ajustement non linéaire à une branche d’hyperbole.

Pour chaque jeu de données expérimentales, les résultats sont présentés dans un même graphique avec un très bon rendu.

Le script peut être utilisé tel qu’il est ou être adapté pour analyser « en batch » les résultats de plusieurs expérimentateurs.

2 - Diagramme Cause-Effet avec R

Une étude de qualité est réalisée dans une entreprise de transformation des fruits de mer.

Une des questions posées porte sur la diminution des coûts liés à la contamination.

L’approche utilisée ici est inspirée du diagramme Causes-Effet tracée très simplement avec le logiciel R.

3- Calcul du point isoélectrique d'une séquence d'acides aminés avec R

La fonction computePI() du module seqinr permet de calculer simplement le pI théorique d’une séquence d’acides aminés avec R.

4- Extraction d'informations des bases de séquences biologiques avec R

Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d’intérêt (nucléotidiques et protéiques) présentes dans les banques en lignes telles que EMBL, GenBank, SwissProt ...

Cette fiche présente une méthode d’extraction des séquences codantes de Gallus gallus à partir de GenBank.

Les données sont ensuite utilisées pour tracer le diagramme de distribution des pI dans cette espèce.