정보

BLAST 2 시퀀스(BLAST+)에서 e-값은 어떻게 계산됩니까?

BLAST 2 시퀀스(BLAST+)에서 e-값은 어떻게 계산됩니까?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

BLAST+ 패키지에서 데이터베이스를 검색하는 대신 두 개의 시퀀스를 정렬할 수 있습니다.

tblastn -쿼리 seq1.fa -주제 seq1.fa

웹 BLAST 문서에 따르면 e-값은 nr 데이터베이스에서 계산됩니다.

BLAST 2 시퀀스는 예상 값을 계산하기 위한 현재 뉴클레오티드 또는 단백질 nr 데이터베이스의 크기, 더 짧은 정렬을 보려면 예상 임계값을 크게 늘려야 할 수 있습니다.

그러나 명령줄 문서에는 데이터베이스와주제순서:

-db  BLAST 데이터베이스 이름 * 다음과 호환되지 않음: subject, subject_loc -subject  검색할 주제 시퀀스 * 호환되지 않음: db, gilist, seqidlist, negative_gilist, db_soft_mask, db_hard_mask

명령줄에서 BLAST-2-Sequences를 사용할 때 e-value는 어떻게 계산됩니까? (나는 nr 데이터베이스를 다운로드하지 않았다고 확신합니다.)

감사 해요!


E-값을 계산하기 위해 BLAST용 nr 데이터베이스가 필요하지 않습니다. n 시퀀스의 정렬을 기반으로 계산됩니다. 정확한 절차는 수학적으로 복잡하지만 원본 논문을 읽으려면 여기를 참조하십시오. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC53667/pdf/pnas01031-0226.pdf

여기에서 찾을 수 있는 단순화된 버전:

http://homepages.ulb.ac.be/~dgonze/TEACHING/stat_scores.pdf


먼저 E-value의 의미를 이해해야 합니다. E-값은 주어진 데이터베이스에서 특정 점수를 갖는 무작위 일치의 가능성입니다. 따라서 E-value를 계산하려면 데이터베이스가 필요하다는 말이 맞습니다. 온라인 알고리즘은 반드시 다음과 같이 계산합니다.nr데이터베이스 하지만 어느 RefSeq 또는 유기체 특정 데이터베이스(nr기본값)입니다.

두 개의 시퀀스를 정렬할 때 E-value는 의미가 없으며 E-value를 전혀 볼 필요가 없습니다. 많은 시퀀스 목록으로 시퀀스를 정렬하는 경우 먼저 다음을 사용하여 선택한 시퀀스의 데이터베이스를 만들어야 합니다.makeblastdb.

이제 정렬을 수행하면 이 데이터베이스에서 E-값이 계산됩니다.


비디오 보기: ხმოვანი წიგნის შექმნა (이월 2023).