인간과 쥐 게놈의 DNA 요소에 대한 확장된 백과사전
홈페이지홈페이지 > 소식 > 인간과 쥐 게놈의 DNA 요소에 대한 확장된 백과사전

인간과 쥐 게놈의 DNA 요소에 대한 확장된 백과사전

Jul 07, 2023

Nature 583권, 699~710페이지(2020)이 기사 인용

86k 액세스

658 인용

328 알트메트릭

측정항목 세부정보

이 기사에 대한 저자 수정 사항은 2022년 4월 26일에 게시되었습니다.

이 기사는 업데이트되었습니다

인간과 쥐의 게놈에는 RNA와 단백질을 지정하고 그 생산의 시기, 규모, 세포적 맥락을 통제하는 지침이 포함되어 있습니다. 이러한 요소를 더 잘 설명하기 위해 ENCODE(Encyclopedia of DNA Elements) 프로젝트의 3단계에서는 RNA 전사, 염색질 구조 및 변형, DNA 메틸화, 염색질 루핑, 전사 인자 및 RNA-1에 의한 점유 등의 세포 및 조직 레퍼토리에 대한 분석을 확장했습니다. 결합 단백질. 여기에서는 마우스 태아 발달에 대한 체계적인 결정을 포함하여 5,992개의 새로운 실험 데이터 세트를 생성한 이러한 노력을 요약합니다. 2단계 ENCODE1 및 Roadmap Epigenomics2 데이터를 포함한 모든 데이터는 ENCODE 데이터 포털(https://www.encodeproject.org)을 통해 확인할 수 있습니다. 우리는 유전자 조절과 관련된 선택된 데이터 유형을 통합하여 각각의 게놈의 7.9%와 3.4%를 포함하는 926,535개의 인간 및 339,815개의 마우스 후보 cis-조절 요소의 레지스트리를 개발하고 웹 기반 서버(SCREEN; http:// screen.encodeproject.org)를 사용하여 이 리소스에 대한 유연한 사용자 정의 액세스를 제공합니다. ENCODE 데이터와 레지스트리는 종합적으로 과학계가 인간과 쥐 게놈의 구성과 기능을 더 잘 이해할 수 있도록 광범위한 리소스를 제공합니다.

인간 게놈은 살아있는 세포와 조직의 다양한 기능을 가능하게 하기 위해 세포 단백질과 RNA 기계에 의해 읽고, 해석되고, 실행되는 DNA 암호화 지침의 방대한 저장소로 구성됩니다. ENCODE 프로젝트는 기능적 요소1,3,4,5,6를 인코딩하는 인간 및 마우스 게놈의 세그먼트를 정확하고 포괄적으로 묘사하는 것을 목표로 합니다. 작동상, 기능적 요소는 분자 산물(예: 단백질 코딩 유전자 또는 비코딩 RNA) 또는 유전자 또는 게놈 조절에서 기계적인 역할을 하는 생화학적 활동(예: 전사 프로모터 또는 인핸서)을 지정하는 개별적이고 선형적으로 정렬된 서열 특징으로 정의됩니다5 . 2003년 ENCODE 파일럿 프로젝트(인간 게놈 서열의 정의된 1%에 초점을 맞춘4)를 시작으로 20071년에 시작된 생산 단계 II에서 전체 게놈으로 확장되는 ENCODE는 일련의 최신 기술을 적용했습니다. 확장된 범위의 세포 및 생물학적 맥락에서 정확도를 높여 가능한 기능적 요소를 식별하는 예술 분석. 비교 기능적 게놈 분석과 인간 생물학 모델링을 위한 실험실용 마우스인 Mus musculus의 가치를 활용하기 위해 보다 제한된 범위의 마우스 ENCODE 프로젝트가 20096년에 시작되었습니다. 동반 Perspective7은 ENCODE의 진화에 대한 추가 컨텍스트를 제공합니다. ENCODE 데이터가 게놈 구조와 기능을 교차하는 기본적인 생물학 및 생물의학 문제를 밝히기 위해 어떻게 사용되는지 프로젝트하고 설명합니다.

2012년부터 인간과 쥐의 ENCODE 프로젝트는 과학계에 폭넓은 힘을 실어주기 위해 기능적 요소를 발견하고 주석을 달고 ENCODE 데이터의 생산, 선별 및 보급을 체계화하기 위한 각자의 노력을 확대하고 심화하기 위한 프로그램을 시작했습니다. ENCODE 데이터는 ENCODE 분석에 포함된 생물학적 및 생화학적 특징의 범위와 이러한 분석이 세포 및 조직 상황에 걸쳐 적용되는 폭과 깊이로 인해 인간 게놈 서열과 생물의학 연구에 대한 적용 사이의 인터페이스 역할을 했습니다. . ENCODE는 이제 (i) RNA 결합 단백질 국소화 및 염색질 루핑과 같은 새로운 분석법을 통합함으로써 이 두 축 모두에서 확장되었습니다. (ii) 전사 인자 염색질 면역침전 및 시퀀싱(ChIP-seq)과 같은 현재 분석이 참조 세포주를 조사하는 깊이를 증가시킵니다. (iii) 일차 세포와 조직에 중점을 두고 크게 확장된 생물학적 범위에 대한 데이터를 수집합니다. 또한 ENCODE는 이제 ENCODE 표준을 준수하는 Roadmap Epigenomics Project2의 실질적인 데이터를 통합하고 균일하게 처리했습니다(방법 참조).

1.64 throughout, and low otherwise./p>2,000 bp for TSS-distal). We defined TSSs as the 5′ ends of all basic transcripts annotated by GENCODE (V24 for human and M18 for mouse). A cCRE was assigned to one of five mutually exclusive groups on the basis of its state and TSS proximity (Box 1): TSS-overlapping with promoter-like signatures (PLS), TSS-proximal with enhancer-like signatures (pELS), TSS-distal with enhancer-like signatures (dELS), not TSS-overlapping and with high DNase and H3K4me3 signals only (DNase–H3K4me3), not TSS-overlapping and with high DNase and CTCF signals only (CTCF-only). Note that this set of seven states and five groups is defined across all biosamples, and therefore is cell-type agnostic. We next define cell type-specific state and group classifications./p>