Các nhà nghiên cứu tại Viện Salk đã tạo ra một bước đột phá trong lĩnh vực di truyền học bằng cách phát triển công cụ ShortStop, sử dụng học máy để khám phá các vùng DNA thường bị bỏ qua trong quá trình tìm kiếm các microprotein có thể đóng vai trò quan trọng trong bệnh tật. Công cụ này đã giúp các nhà khoa học xác định được những vùng DNA có tiềm năng mã hóa microprotein và dự đoán khả năng sinh học của chúng, từ đó tiết kiệm thời gian và chi phí trong việc tìm kiếm các microprotein liên quan đến sức khỏe và bệnh tật.

ShortStop hoạt động dựa trên nguyên tắc phân loại microprotein thành hai loại: chức năng và không chức năng. Quá trình phân loại này được thực hiện dựa trên dữ liệu huấn luyện lấy từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Bằng cách so sánh các microprotein tìm thấy với các mẫu giả, ShortStop có thể nhanh chóng đưa ra quyết định về khả năng chức năng của một microprotein mới. Điều này cho phép các nhà nghiên cứu tập trung vào những microprotein có tiềm năng chức năng cao, tăng hiệu quả của quá trình nghiên cứu.
Khi áp dụng ShortStop vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã xác định được 8% microprotein có khả năng chức năng, và ưu tiên chúng cho việc theo dõi tiếp theo. Công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người. Điều này chứng tỏ khả năng của ShortStop trong việc khám phá những vùng DNA bị bỏ qua và xác định các microprotein mới có tiềm năng chức năng.
Công cụ ShortStop đã được sử dụng để phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường, nhằm tạo ra danh sách các microprotein tiềm năng chức năng. Trong số các microprotein mà ShortStop tìm thấy, một số nổi bật đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường, cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi. Việc xác định microprotein liên quan đến ung thư phổi này đã chứng minh giá trị của ShortStop và học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai.
Các nhà nghiên cứu hy vọng rằng ShortStop sẽ giúp họ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật, từ đó mở ra những con đường mới cho việc chẩn đoán và điều trị các bệnh như ung thư và Alzheimer. Với khả năng khám phá các vùng DNA bị bỏ qua và xác định các microprotein có tiềm năng chức năng, ShortStop được kỳ vọng sẽ đóng góp vào những tiến bộ quan trọng trong lĩnh vực y học trong tương lai.