A pairwise sequence alignment from a BLAST report
The alignment is preceded by the sequence identifier, the full definition line, and the length ofthe matched sequence, in amino acids. Next comes the bit score (the raw score is inparentheses) and then the E-value. The following line contains information on the number ofidentical residues in this alignment (Identities), the number of conservative substitutions (Positives), and if applicable, the number of gaps in the alignment. Finally, the actual alignment is shown, with the query on top, and the database match is labeled as Sbjct, below. The numbersat left and right refer to the position in the amino acid sequence. One or more dashes (–) withina sequence indicate insertions or deletions. Amino acid residues in the query sequence thathave been masked because of low complexity are replaced by Xs (see, for example, the fourth and last blocks). The line between the two sequences indicates the similarities between the sequences. If the query and the subject have the same amino acid at a given location, theresidue itself is shown. Conservative substitutions, as judged by the substitution matrix, areindicated with +.
The traditional report is really designed for human readability, as opposed to being parsed bya program. For example, the one-line descriptions are useful for people to get a quick overview of their search results, but they are rarely complete descriptors because of limited space. Also, for convenience, there are several pieces of information that are displayed in both the one-line descriptions and alignments (for example, the E-values, scores, and descriptions); therefore,the person viewing the search output does not need to move back and forth between sections. New features may be added to the report, e.g., the addition of links to Entrez Gene records(Chapter 19) from sequence hits, which result in a change of output format. These are easy forpeople to pick up on and take advantage of but can trip programs that parse this BLAST output.
Wyrównanie jest poprzedzona identyfikatorem sekwencji, pełną linię definicji, a długość rozporz dopasowane sekwencji, w aminokwasów. Następnie przychodzi ocena bitowy (surowy wynik to inparentheses) i E-value. Następujący wiersz zawiera informacje na temat liczby ofidentical pozostałości, w tym dostosowanie (tożsamości), liczba konserwatywnych substytucji (pozytywnych), a jeżeli ma to zastosowanie, liczba luk w układzie. Ponadto w praktyce dostosowanie jest widoczna, z zapytanie na wierzchu, a mecz w bazie jest oznaczone jako Sbjct poniżej. Numbersat lewo i prawo odwołać się do stanowiska w sekwencji aminokwasów. Jeden lub więcej kresek (-) sekwencja withina wskazują dopiski lub skreślenia. Reszt aminokwasowych w zapytaniu ciągu thathave zostały zamaskowane z powodu niskiej złożoności otrzymują XS (patrz, na przykład, czwarty i ostatni bloki). Linii pomiędzy dwoma sekwencjami wskazuje na podobieństwa między sekwencjami. Jeśli zapytanie i podlegają te same aminokwasu w danym miejscu, theresidue się pojawi. Konserwatywna zastępstw, jak oceniane przez macierz substytucji areindicated z +.
Tradycyjne sprawozdanie jest rzeczywiście przeznaczony dla ludzi czytelność, a nie jest analizowany program bya. Na przykład, jeden opisy linii są przydatne dla osób, aby uzyskać szybki przegląd wyników wyszukiwania, ale rzadko są one kompletne deskryptorów ze względu na ograniczoną przestrzeń. Ponadto, dla wygody, istnieje wiele rodzajów informacji, które są wyświetlane zarówno w jednej linii opisy i wyrównania (na przykład e-wartości, wyniki i opisy), w związku z osobą wyświetlającą wynik wyszukiwania nie ma potrzeby przenieść się tam iz powrotem pomiędzy sekcjami. Nowe funkcje mogą być dodawane do raportu, np. dodawania linków do Entrez rekordy Gene (rozdział 19) z hits kolejności, w wyniku których zmiana formatu wyjściowego. Są łatwe forpeople podnieść się i korzystać z programów, ale podróż, że analizy tego wyjścia Blast.