이 AI는 원자 수준의 정밀도로 생명의 기계를 설계할 수 있습니다

Photo of author

By Valentina J Researcher

RoseTTAFold protein dark 768x432 1

단백질은 사회적 생물이다. 그들도 카멜레온이에요. 세포의 필요에 따라 그들은 빠르게 구조를 변형하고 복잡한 춤을 추며 다른 생체분자를 붙잡습니다.

분자 만찬 극장이 아닙니다. 오히려 이러한 파트너십은 생물학적 과정의 핵심입니다. 일부는 유전자를 켜거나 끕니다. 다른 사람들은 노화된 “좀비” 세포를 조금씩 움직여 자멸하거나 뇌 네트워크를 재구성하여 인지와 기억을 최상의 상태로 유지합니다.

이러한 연결은 이미 광범위한 치료법에 영감을 주었으며, 생체분자를 모델링하고 설계할 수 있는 AI를 통해 새로운 치료법이 가속화될 수 있습니다. 그러나 이전 AI 도구는 단백질과 그 상호 작용에만 초점을 맞춰 비단백질 파트너를 제쳐두었습니다.

이번 주 사이언스 (Science) 에 실린 한 연구는 산소 운반체의 중심을 형성하는 철 함유 소분자를 포함해 단백질을 물리적으로 붙잡는 다양한 다른 생체분자를 모델링하는 AI의 능력을 확장했습니다.

워싱턴 대학의 데이비드 베이커(David Baker) 박사가 이끄는 새로운 AI는 생체분자 설계의 범위를 넓힙니다. RoseTTAFold All-Atom이라고 불리는 이 시스템은 이전의 단백질 전용 시스템을 기반으로 DNA 및 RNA와 같은 수많은 다른 생체분자를 통합합니다. 또한 특정 단백질 기능에 필수적인 철분과 같은 작은 분자를 추가합니다.

AI는 3D 구조에 대한 지식 없이 구성 요소의 순서와 구조로만 학습했지만 원자 수준에서 복잡한 분자 기계를 매핑할 수 있습니다.

연구에서 RoseTTAFold All-Atom은 생성 AI와 결합하여 심장병 약물을 쉽게 잡을 수 있는 단백질을 생성했습니다. 이 알고리즘은 또한 혈액이 산소를 운반하는 데 도움이 되는 철분이 풍부한 분자인 헴과 신진대사를 위해 빛을 흡수하는 식물과 박테리아의 화학물질인 빌린을 조절하는 단백질을 생성했습니다.

이러한 예는 단지 개념 증명일 뿐입니다. 팀은 과학자들을 위해 RoseTTAFold All-Atom을 대중에게 공개하여 단백질 복합체보다 훨씬 더 복잡하고 상호 작용하는 여러 생체 구성 요소를 만들 수 있습니다. 결과적으로, 그 창조물은 새로운 치료법으로 이어질 수 있습니다.

연구 저자인 Woody Ahern은 보도 자료에서 “여기서 우리의 목표는 보다 정교한 치료법과 기타 유용한 분자를 생성할 수 있는 AI 도구를 구축하는 것이었습니다.”라고 말했습니다.

드림온

2020년에는 Google DeepMind의 AlphaFold와 Baker Lab의 RoseTTAFold가 반세기 동안 과학자들을 당혹스럽게 만들었던 단백질 구조 예측 문제를 해결하고 단백질 연구의 새로운 시대를 열었습니다. 이러한 알고리즘의 업데이트된 버전은 과학에 알려지거나 알려지지 않은 모든 단백질 구조를 매핑했습니다.

다음으로, OpenAI의 ChatGPT와 Google의 Gemini의 기반 기술인 생성 AI는 인상적인 활동 범위를 통해 디자이너 단백질의 창의적인 열풍을 촉발했습니다. 새로 생성된 일부 단백질은 칼슘 수치를 조절하는 호르몬을 조절했습니다. 다른 것들은 전자 회로의 트랜지스터처럼 쉽게 모양을 바꿀 수 있는 인공 효소나 단백질을 만들어 냈습니다 .

생성 AI는 단백질 구조의 새로운 세계를 환각함으로써 우리의 생물학과 건강을 조절하는 합성 단백질 세대를 꿈꿀 수 있는 잠재력을 가지고 있습니다.

하지만 문제가 있습니다. 디자이너 단백질 AI 모델은 터널 비전을 가지고 있습니다. 그들은 단백질에 너무 집중합니다.

생명체의 분자 구성요소를 구상할 때, 단백질, DNA, 지방산이 떠오릅니다. 그러나 세포 내부에서 이러한 구조는 주변 구성 요소와 맞물리는 작은 분자에 의해 결합되어 기능적인 생체 조립체를 형성하는 경우가 많습니다.

한 가지 예는 철을 포함하는 고리 모양의 분자인 헴입니다. 헴은 적혈구의 헤모글로빈의 기초로, 몸 전체에 산소를 운반하고 다양한 화학 결합을 사용하여 주변 단백질 “고리”를 붙잡습니다.

일련의 분자 “문자”로 모델링할 수 있는 단백질이나 DNA와 달리 작은 분자와 그 상호 작용은 포착하기 어렵습니다. 그러나 그것들은 생물학의 복잡한 분자 기계에 매우 중요하며 그 기능을 극적으로 바꿀 수 있습니다.

이것이 바로 새로운 연구에서 연구자들이 단백질을 넘어 AI의 범위를 넓히는 것을 목표로 삼은 이유입니다.

저자들은 논문에서 “우리는 단백질, DNA 및 기타 변형을 포함한 생물학적 분자에 대해 모든 원자에 대한 3D 좌표를 생성할 수 있는 구조 예측 방법을 개발하기 시작했습니다”라고 썼습니다.

태그팀

팀은 다른 분자를 통합하기 위해 이전의 단백질 모델링 AI를 수정하는 것으로 시작했습니다.

AI는 세 가지 수준에서 작동합니다. 첫 번째는 페이지의 단어와 같은 단백질의 1차원 “문자” 순서를 분석합니다. 다음으로, 2D 지도는 각 단백질 “단어”가 다른 단백질 “단어”와 얼마나 멀리 떨어져 있는지 추적합니다. 마지막으로 GPS와 약간 유사한 3D 좌표가 단백질의 전체 구조를 매핑합니다.

그런 다음 업그레이드가 이루어집니다. 소분자 정보를 모델에 통합하기 위해 팀은 원자 위치와 화학적 연결에 대한 데이터를 처음 두 레이어에 추가했습니다.

세 번째에서는 키랄성, 즉 화학물질의 구조가 왼쪽인지 오른쪽인지에 초점을 맞췄습니다. 우리 손과 마찬가지로 화학 물질도 생물학적 결과가 크게 다른 거울 구조를 가질 수 있습니다 . 장갑을 끼는 것과 마찬가지로, 화학 물질의 올바른 “사용법”만이 주어진 바이오 조립 “장갑”에 맞을 수 있습니다.

그런 다음 RoseTTAFold All-Atom은 단백질, 소분자 및 이들의 상호 작용을 설명하는 수십만 개의 데이터 포인트가 포함된 여러 데이터 세트에 대해 교육을 받았습니다. 결국, 그럴듯한 단백질 어셈블리를 만드는 데 유용한 작은 분자의 일반적인 특성을 배웠습니다. 온전한 점검으로 팀은 안정적이고 기능적인 생체 조립으로 이어지는 고품질 예측을 식별하기 위해 “신뢰도 게이지”도 추가했습니다.

이전의 단백질 전용 AI 모델과 달리 RoseTTAFold All-Atom은 “전체 생체분자 시스템을 모델링할 수 있습니다”라고 팀은 썼습니다.

일련의 테스트에서 업그레이드된 모델은 단백질과 비단백질 분자 간의 상호 작용을 신속하게 예측함으로써 약물 발견의 핵심 구성 요소인 특정 단백질에 작은 분자를 “도킹”하는 방법을 학습할 때 이전 방법보다 성능이 뛰어났습니다.

용감한 새로운 세계

작은 분자를 통합하면 완전히 새로운 수준의 맞춤형 단백질 디자인이 열립니다.

개념 증명으로 팀은 RoseTTAFold All-Atom을 이전에 개발 한 생성 AI 모델과 결합 하고 세 가지 다른 작은 분자에 대한 단백질 파트너를 설계했습니다.

첫 번째는 심장병 치료에 사용되지만 부작용이 있을 수 있는 디곡시게닌(digoxigenin)이었습니다. 이를 붙잡는 단백질은 독성을 감소시킵니다. 분자에 대한 사전 지식 없이도 AI는 배양된 세포에서 테스트할 때 디곡시게닌 수준을 조절하는 여러 단백질 결합제를 설계했습니다.

AI는 또한 적혈구의 산소 전달에 중요한 작은 분자인 헴(heme)과 다양한 생물이 빛을 흡수하는 데 도움이 되는 빌린(bilin)에 결합하는 단백질을 설계했습니다.

연구팀은 이전 방법과 달리 AI는 전문 지식 없이도 작은 분자를 붙잡는 “새로운 단백질을 쉽게 생성”할 수 있다고 설명했습니다.

또한 원자 수준에서 단백질과 작은 분자 사이의 연결 강도를 매우 정확하게 예측할 수 있어 복잡한 생체분자 구조로 이루어진 완전히 새로운 우주를 합리적으로 구축하는 것이 가능해집니다.

Baker는 “전 세계의 과학자들이 전례 없는 정밀도로 생체분자를 생성할 수 있도록 지원함으로써 우리는 의학, 재료 과학 및 그 이상의 미래를 형성할 획기적인 발견과 실용적인 응용의 문을 열고 있습니다.”라고 말했습니다.

이미지 제공: Ian C. Haydon

Leave a Comment