[Enhanced Residue Embeddings and Ligand-Integrated model for Prediction of Accurate Protein-Ligand binding Residue]
단백질은 생체 내에서 다양한 생리학적 과정에 필수적으로 참여하며, 이를 위해 다른 분자들과 상호작용한다.
상호작용에 참여하는 단백질 내 리간드가 결합하는 잔기를 찾는 것은 분자 간 상호작용의 메커니즘을 이해하고, 이는 약물 발견 및 설계에 대한 통찰력을 제공한다.
대표적인 단백질-리간드 결합 잔기 예측 방법은 서열기반의 방법과 구조기반의 방법으로 분류할 수 있다. 일반적으로 단백질-리간드 결합 잔기 예측 연구에서 구조기반의 방법이 좋은 결과를 보여왔다. 하지만, 구조기반의 방법은 단백질의 구조 데이터가 필수적으로 필요하며, 대규모 단백질 데이터 셋에 대해서는 많은 시간과 자원을 소모하기 때문에 최근에는 서열 기반의 방법이 주목받고 있다. 서열 기반의 방법에서도 대부분의 연구들은 리간드에 대한 정보는 활용하지 않는다. 본 연구에서는 리간드에 대한 정보 및 자연어 처리 분야의 토큰 분류 기법을 활용한 단백질 내 리간드 결합 잔기 예측 모델을 제안한다.