Thuật toán dự báo rối loại protein phù hợp
T.K
01/08/2019
KH&CN nước ngoài
Rối loạn protein tác động mạnh đến các chức năng sinh học, đặc biệt là rối loạn trong cấu trúc protein. Các protein có vùng bị rối loạn có thể bị kết dính lại giữa các tế bào, gây ra một số bệnh thoái hóa về thần kinh. Do đó, việc có thể xác định các vùng bị rối loạn trong protein là rất quan trọng.
Tuy nhiên, rất khó và phải tốn rất nhiều thời gian để xác định các hướng cấu trúc của polypeptide trong thực tế. Do đó, cần phải có phương pháp tin sinh học để dự đoán các rối loạn này của protein.
Trong thời gian gần đây, các nhà nghiên cứu đã xây dựng nhiều thuật toán để tách các chuỗi peptide khỏi các chuỗi khác, dựa trên nhiều 'tính năng' khác nhau, xuất phát từ các thông số hóa lý (như điện tích hoặc tính kỵ nước của axit amin),...cũng như xem xét các bước chuyển hóa liên quan
Trong tình hình có nhiều thuật toán dự báo như vậy, việc có các bộ giá trị chuẩn để phục vụ cho việc kiểm chuẩn dự báo là rất cần thiết. Nielsen và Mulder đã xây dựng và tạo ra bộ kiểm chuẩn đặc hiệu tại hiện trường, ứng dụng dữ liệu hóa của hơn một trăm protein chọn lọc. Sau đó, họ phân tích hiệu suất 26 phương pháp dự đoán rối loạn đang được sử dụng rộng rãi và thấy rằng những phương pháp này có kết quả rất khác nhau.
Các so sánh chi tiết được thực hiện trong nghiên cứu này sẽ giúp các nhà khoa học protein lựa chọn được giải thuật thích hợp nhất để ứng dụng trong thực tiễn.