El formato de archivo FASTA se utiliza para almacenar los datos de la secuencia de ácidos nucleicos o péptidos. Múltiples secuencias pueden ser almacenados en un único archivo , llamado un archivo de múltiples FASTA . Secuencias de datos se formatean como una línea de cabecera corta identificar la secuencia y la secuencia de datos después de una nueva línea. Mediante la localización de las cabeceras de secuencia en un archivo de múltiples FASTA con los comandos de Perl , es posible extraer secuencias individuales a partir de un archivo de múltiples FASTA . Instrucciones
1
Abra un editor de texto con un archivo de texto en blanco para empezar un nuevo programa de Perl.
2
Comienza el programa especificando la localización de Perl en su sistema. Esto es normalmente " /usr /bin /perl " o "/usr /local /bin /perl ".
# /Usr /bin /perl
3
Importe el " :: nombre base del archivo " bibliotecas "estricto " y . La biblioteca "File :: Nombre base " apoya el análisis de rutas de archivos y extensiones. La biblioteca "estricta" restringe construcciones inseguras , arrojando un error durante la compilación y no en tiempo de ejecución.
Uso del archivo strictuse :: Nombre base
4
Leer la variable argumento de la línea de comandos . Su programa , en caso de que optar por el nombre de " fasta_extract.pl , " se espera tener la ubicación de un archivo FASTA y los parámetros para elegir las secuencias de extraer. El primer parámetro será un nombre de archivo FASTA y la segunda será una cadena de coincidencia de patrones . Se accede a variables argumento de la " ARGV $" array
my $ fasta_file = $ ARGV [ 0 ] ; . My $ pattern = $ argv [ 1 ] ;
5
abierto el archivo FASTA utilizando la función " open () " . Se especificará el programa para dejar de fumar si no se puede abrir el archivo usando el comando "die "
abierto (INPUT , $ fasta_file )