howhenno.ru

Como converter um arquivo TXT para FASTA

Estudos clínicos são realizadas para analisar os dados de sequências de proteínas e de encontrar tratamentos para doenças. dados sequência de proteínas é colocado na (fast-all) formato FASTA para que os programas de software entender como processar a sequência de dados. O formato FASTA tem até 80 caracteres por linha de sequence data e utiliza o IUB / IUPAC (International Union of Biochemistry / União Internacional de Química Pura e Aplicada) padrão de código. Convertendo um TXT (texto simples) arquivo para o formato FASTA envolve editar ou adicionar sequence data formatada-FASTA para um arquivo de texto existente com linhas de sequence data proteínas. programas de editor de texto como o Bloco de Notas fazer esta simples de fazer.

  • Abra o arquivo de texto sequência de proteína que você deseja editar em um programa de edição de texto, como o Bloco de Notas.



  • Editar ou adicionar a linha de descrição para seguir o formato FASTA. Por exemplo,> gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEÍNA (OVALBUMINA-relacionado) é uma linha de descrição FASTA válido. Esta linha fornece uma descrição única para as linhas sequence data que se seguem. O formato FASTA requer o uso do símbolo maior que (>) para que o programa de software pode identificar a informação descritiva única e evitar o tratamento a descrição como uma linha de sequência de dados de proteína.

  • Pressione a tecla "Enter" para inserir uma quebra de linha uma vez que a linha de descrição é editado.



  • Editar ou adicionar o formato de linha de sequence data proteína para estar em conformidade com os códigos padrão IUB / IUPAC. O padrão IUB / IUPAC usa as letras do alfabeto para representar códigos aceitáveis ​​ou sequências de consulta de aminoácidos ou de ácidos nucleicos, no formato FASTA. Por exemplo, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE
    representa uma linha de sequence data válida, uma vez que começa com a letra "Q", representando glutamina, e termina com a letra "E", representando glutamato.



  • Adicionar mais linhas de dados seqüência, editar linhas de sequence data existentes ou adicionar quebras de linha depois de 80 caracteres, conforme necessário. Aderindo aos padrões de linha de sequence data FASTA e quebras de linha garante que o programa segue as instruções relacionadas com glutamina, glutamato e outros códigos de letras. As letras no padrão IUB / IUPAC são simplesmente instruções para o programa de software que processa os dados FASTA formatado.

  • Clique em "Arquivo", selecione "Salvar" e clique no botão "Salvar". Seu arquivo TXT está agora em formato FASTA.

Compartilhar em redes sociais:

Similar