Thang điểm trong đánh giá chuỗi di truyền

Scoring Schemes là bộ thang điểm được sử dụng để tính toán điểm tương đồng giữa các cặp nucleotide hoặc amino acid trong quá trình alignment. BLOSUM là ma trận được sử dụng trong pairwise alignment protein, có độ phân giải khác nhau như BLOSUM30, BLOSUM62, BLOSUM80 tùy thuộc vào độ tương đồng protein. PAM là thang điểm sử dụng trong pairwise alignment nucleotide, đánh giá mức độ tương đồng giữa các cặp nucleotide. Sử dụng các thang điểm phù hợp sẽ cải thiện tính chính xác và hiệu quả của kết quả alignment trong nghiên cứu di truyền và sinh học phân tử.

1. Tổng quan về Scoring Schemes

Scoring Schemes là một khái niệm trong nghiên cứu di truyền và sinh học phân tử, đề cập đến một bộ các thang điểm (scoring scheme) được sử dụng để tính toán điểm tương đồng giữa các cặp nucleotide hoặc amino acid trong quá trình alignment. Thang điểm thường bao gồm hai thành phần chính là điểm khớp (match score) và điểm không khớp (mismatch penalty), được sử dụng để đánh giá mức độ tương đồng giữa các cặp nucleotide hoặc amino acid trong các chuỗi dữ liệu.

Các thang điểm khác nhau có thể được sử dụng tùy thuộc vào mục đích của nghiên cứu và đặc tính của dữ liệu. Ví dụ, thang điểm BLOSUM được sử dụng trong pairwise alignment protein, trong khi đó thang điểm PAM được sử dụng trong pairwise alignment nucleotide. Các thang điểm phù hợp sẽ giúp cải thiện tính chính xác và hiệu quả của kết quả alignment và đóng vai trò quan trọng trong nghiên cứu di truyền và sinh học phân tử.

2. Thang điểm BLOSUM

BLOSUM (Blocks Substitution Matrix) được dùng để đánh giá mức độ tương đồng giữa các cặp amino acid trong quá trình alignment. Kết quả thu được từ việc sử dụng BLOSUM là một ma trận thay thế, cho biết điểm tương ứng của mỗi cặp amino acid trong quá trình alignment. Các ma trận BLOSUM khác nhau (ví dụ: BLOSUM30, BLOSUM62, BLOSUM80) có độ phân giải khác nhau và phù hợp với các mục đích alignment khác nhau.

  • BLOSUM30: Thang điểm có độ phân giải thấp hơn, phù hợp cho việc alignment các protein có độ tương đồng thấp. BLOSUM30 được sử dụng trong các nghiên cứu so sánh giữa các protein có mức độ tương đồng thấp hoặc trong việc tìm kiếm các định dạng protein mới.
  • BLOSUM62: Thang điểm có độ phân giải trung bình, phù hợp cho việc alignment các protein có độ tương đồng trung bình. BLOSUM62 là thang điểm phổ biến nhất và được sử dụng rộng rãi trong các công cụ alignment protein.
  • BLOSUM80: Thang điểm có độ phân giải cao, phù hợp cho việc alignment các protein có độ tương đồng cao. BLOSUM80 được sử dụng trong các nghiên cứu so sánh giữa các protein có mức độ tương đồng cao.
Thang điểm BLOSUM62
Thang điểm BLOSUM62

Khi sử dụng BLOSUM trong quá trình pairwise alignment protein, mỗi cặp amino acid trong hai chuỗi protein sẽ được so sánh với nhau và đánh giá bằng điểm tương ứng trong ma trận thay thế BLOSUM. Các amino acid khớp sẽ được ghi nhận với điểm tương ứng trong ma trận thay thế, trong khi các amino acid không khớp sẽ bị trừ điểm. Điểm alignment cuối cùng sẽ được tính dựa trên tổng điểm của các cặp amino acid trong quá trình alignment.

Kết quả thu được từ việc sử dụng BLOSUM là một alignment protein chính xác hơn và hiệu quả hơn, giúp cung cấp thông tin hữu ích cho nghiên cứu về cấu trúc và chức năng của protein. BLOSUM là một trong những thang điểm phổ biến nhất được sử dụng trong quá trình pairwise alignment protein.

3. Thang điểm PAM

PAM (Point Accepted Mutation) là một thang điểm (scoring scheme) được sử dụng trong pairwise alignment nucleotide, để đánh giá mức độ tương đồng giữa các cặp nucleotide trong quá trình alignment. PAM được tính toán dựa trên các mô hình tiến hóa nucleotide và có độ phân giải khác nhau (ví dụ: PAM30, PAM70, PAM250). Ý nghĩa của các thang điểm PAM là:

  • PAM30: Thang điểm có độ phân giải thấp hơn, phù hợp cho việc alignment các chuỗi nucleotide có độ tương đồng thấp. PAM30 được sử dụng trong các nghiên cứu so sánh giữa các chuỗi nucleotide có mức độ tương đồng thấp hoặc trong việc tìm kiếm các chuỗi nucleotide mới.
  • PAM70: Thang điểm có độ phân giải trung bình, phù hợp cho việc alignment các chuỗi nucleotide có độ tương đồng trung bình. PAM70 là thang điểm phổ biến nhất và được sử dụng rộng rãi trong các công cụ alignment nucleotide.
  • PAM250: Thang điểm có độ phân giải cao, phù hợp cho việc alignment các chuỗi nucleotide có độ tương đồng cao. PAM250 được sử dụng trong các nghiên cứu so sánh giữa các chuỗi nucleotide có mức độ tương đồng cao.
Thang điểm PAM250
Thang điểm PAM250

4. Các thang điểm khác

Ngoài BLOSUM và PAM, còn có một số bộ thang điểm khác được sử dụng trong pairwise alignment nhưng ít phổ biến hơn. Ví dụ như thang điểm VTML (Variable Time-delay Multivariate Linear regression), được sử dụng cho việc align các họ protein có sự khác biệt trong vùng giữa các domain. Thang điểm GONNET cũng được sử dụng trong protein alignment, với độ phân giải cao hơn so với BLOSUM và PAM. Tuy nhiên, GONNET có kích thước ma trận lớn hơn, do đó cần nhiều tài nguyên tính toán hơn. Các bộ thang điểm khác như JTT và WAG được sử dụng cho việc align các sequence protein dài và có sự đa dạng cao. Tùy thuộc vào mục đích của alignment và đặc điểm của các chuỗi cần phân tích, người sử dụng có thể lựa chọn bộ thang điểm phù hợp để đạt được kết quả alignment chính xác và hiệu quả nhất.


Posted

in

,

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *