구글 딥마인드, 새로운 유전체 해석 ai 모델 '알파게놈’ 발표 - ai타임스

구글 딥마인드가 단백질 구조 예측으로 과학계를 뒤흔든 알파폴드(AlphaFold)의 성과를 DNA 영역으로 확장한 AI 모델 ‘알파게놈(AlphaGenome)’을 공개했다.

구글 딥마인드는 28일(현지시간) 네이처(Nature)에 발표한 논문에서 알파게놈을 소개하며, 이 모델이 방대한 분자 생물학 데이터를 학습해 수천개 유전자의 기능과 변이를 예측할 수 있다고 밝혔다.

딥마인드는 2020년 알파폴드2를 공개해 단백질의 3차원 구조를 정밀하게 예측하는 데 성공했고, 이 공로로 데미스 허사비스와 존 점퍼 등 연구진은 2024년 노벨 화학상을 공동 수상했다. 알파폴드는 전 세계 과학자들이 단백질의 정상 작동과 질병 발생 메커니즘을 연구하고, 새로운 단백질을 설계하는 데 널리 활용되고 있다.

딥마인드는 다음 단계로 DNA를 겨냥했다. 연구진은 알파게놈이 유전체가 실제로 어떻게 작동하는지를 예측함으로써 질병 발생 메커니즘을 밝히고 신약 탐색 속도를 높일 수 있을 것으로 보고 있다. 예를 들어 특정 돌연변이가 유전자 기능을 차단하거나 비정상적인 시점에 발현되도록 만드는지를 예측해, 암을 비롯한 희귀 질환 연구에 새로운 단서를 제공할 수 있다는 설명이다.

알파게놈은 인간 유전체 30억개 염기 가운데 단백질을 직접 암호화하지 않는 98%의 이른바 ‘다크 게놈(dark genome)’까지 분석할 수 있도록 설계됐다.

또 한번에 최대 100만개 염기서열을 처리하며, 유전자 발현 조절, 스플라이싱(유전 정보 일부를 건너뛰어 다양한 단백질을 만드는 과정) 등 11가지 생물학적 과정을 동시에 예측한다.

연구진에 따르면, 여러 벤치마크에서 기존 전문 모델들과 비슷하거나 더 나은 성능을 보였다.

특히, 돌연변이 영향 예측에서 강점을 보였다. 연구진은 면역세포의 성숙 과정에 핵심적인 역할을 하는 TAL1 유전자에서 약 8000염기 떨어진 위치의 돌연변이가 백혈병을 일으키는 사례를 실험했으며, 알파게놈은 해당 변이가 TAL1 유전자를 정상적으로 차단되지 않게 만들어 발현을 계속 유지하도록 한다는 점을 정확히 예측해 냈다.

이 결과를 접한 유니버시티 칼리지 런던의 마크 맨수어 박사는 “수년간 실험으로 밝혀낸 결과를 AI가 재현하는 것을 보고 충격을 받았다”라고 평했다.

외부 전문가들도 기술적 성취를 높이 평가했다. 콜드스프링하버연구소의 피터 쿠 박사는 “유전체에 AI를 적용하는 중요한 진전이자 공학적 걸작”이라고 말했다. 샌프란시스코 글래드스톤연구소의 캐서린 폴라드 박사도 “최첨단(SOTA)”이라며 연구 도구로서의 가치를 인정했다.

다만, 한계에 대한 지적이 적지 않다. 예일대의 마크 거스타인 박사는 “알파폴드와 같은 결정적 돌파구는 아니며, 노벨상을 받을 성격의 성과는 아니다”라고 선을 그었다. 존스홉킨스대의 스티븐 살즈버그 박사는 학습 데이터 자체에 대한 불확실성을 지적하며 “현재로서는 실질적 가치가 없다고 본다”라고 비판했다.

임상 적용까지의 거리도 과제로 남아 있다. 알파게놈은 단일 표준 유전체에서 한개 변이의 영향을 예측하는 데 초점을 맞췄지만, 실제 사람들은 수백만개의 유전적 차이를 가지고 있다. 또 10만 염기 이상 떨어진 장거리 유전자 조절 예측이나, 조직별로 다른 유전자 활용 방식에 대해서는 정확도가 떨어진다는 평이다.

딥마인드 연구진은 알파게놈을 “실험을 대체하는 도구가 아니라, 실험을 더 똑똑하게 설계하도록 돕는 예측 도구”로 규정했다.

또 신약 표적 발굴, 희귀 질환 원인 규명, 합성생물학과 유전자 치료 설계 등으로 활용 범위를 넓히겠다는 계획이다.