정보

유전체학* - 생물학

유전체학* - 생물학


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

유전체학

핵산에 대한 연구는 DNA의 발견과 함께 시작되어 유전자와 작은 단편에 대한 연구로 발전하여 현재는 유전체학. 유전체학은 전체 유전자 세트, 뉴클레오티드 서열 및 조직, 종 내 및 다른 종과의 상호 작용을 포함한 전체 게놈에 대한 연구입니다. 유전체학의 발전은 DNA 시퀀싱 기술에 의해 가능하게 되었습니다. 정보 기술이 Google 지도로 발전하여 전 세계의 위치에 대한 자세한 정보를 얻을 수 있게 했듯이 게놈 정보는 서로 다른 유기체의 DNA에 대한 유사한 지도를 만드는 데 사용됩니다.

게놈 매핑

게놈 매핑은 각 염색체에서 유전자의 위치를 ​​찾는 과정입니다. 생성된 지도는 우리가 거리를 탐색하는 데 사용하는 지도와 비슷합니다. NS 유전자 지도 염색체 상의 유전자와 그 위치를 나열한 그림입니다. 유전자 지도는 큰 그림(주간 고속도로 지도와 유사)을 제공하고 유전자 마커(랜드마크와 유사)를 사용합니다. 유전적 마커는 관심 형질과 유전적 연관을 보여주는 염색체 상의 유전자 또는 서열입니다. 유전자 마커는 관심 유전자와 함께 유전되는 경향이 있습니다. 그들 사이의 거리 측정 중 하나는 감수 분열 동안의 재조합 빈도입니다. 초기 유전학자들은 이것을 연관 분석이라고 불렀습니다.

물리적 지도 염색체의 더 작은 영역에 대한 자세한 정보를 얻으십시오(상세 로드맵과 유사). 물리적 지도는 유전자 또는 유전적 마커 사이의 물리적 거리를 뉴클레오티드 단위로 표현한 것입니다. 유전자 연결 지도와 물리적 지도 모두 게놈의 완전한 그림을 구축하는 데 필요합니다. 완전한 게놈 지도가 있으면 연구자가 개별 유전자를 더 쉽게 연구할 수 있습니다. 인간 게놈 지도는 연구자들이 암, 심장병, 낭포성 섬유증과 같은 질병과 관련된 인간 질병 유발 유전자를 식별하는 데 도움이 됩니다. 또한 게놈 매핑을 사용하여 오염 물질을 청소하거나 오염을 예방할 수 있는 능력이 있는 미생물과 같은 유익한 특성을 가진 유기체를 식별할 수 있습니다. 식물 게놈 지도 작성과 관련된 연구는 더 높은 작물 수확량을 생산하는 농업 방법이나 기후 변화에 더 잘 적응하는 식물의 개발로 이어질 수 있습니다.

그림 1. 이것은 인간 X 염색체의 물리적 지도입니다.

크레딧: NCBI, NIH의 작업 수정

유전 지도는 개요를 제공하고 물리적 지도는 세부 정보를 제공합니다. 두 가지 유형의 게놈 매핑 기술이 큰 그림을 보여주는 데 왜 중요한지 이해하기 쉽습니다. 각 기술에서 얻은 정보는 게놈 연구에 조합하여 사용됩니다. 게놈 매핑은 연구에 사용되는 다양한 모델 유기체와 함께 사용됩니다. 게놈 매핑은 여전히 ​​진행 중인 프로세스이며 더 고급 기술이 개발됨에 따라 더 많은 발전이 예상됩니다. 게놈 매핑은 사용 가능한 모든 데이터를 사용하여 복잡한 퍼즐을 완성하는 것과 유사합니다. 전 세계의 실험실에서 생성된 매핑 정보는 NCBI(National Center for Biotechnology Information)와 같은 중앙 데이터베이스에 입력됩니다. 연구자와 일반 대중이 보다 쉽게 ​​정보에 접근할 수 있도록 노력하고 있습니다. 종이 지도 대신 GPS를 사용하여 도로를 탐색하는 것처럼 NCBI를 사용하면 게놈 뷰어 도구를 사용하여 데이터 마이닝 프로세스를 단순화할 수 있습니다.

전체 게놈 시퀀싱

최근 몇 년 동안 의학 분야에서 상당한 발전이 있었지만 의사들은 여전히 ​​많은 질병으로 인해 혼란스러워하고 있으며 연구자들은 문제의 근본 원인을 파악하기 위해 전체 게놈 시퀀싱을 사용하고 있습니다. 전체 게놈 시퀀싱 전체 게놈의 DNA 서열을 결정하는 과정입니다. 전체 게놈 시퀀싱은 질병의 핵심에 유전적 기반이 있을 때 문제를 해결하기 위한 무차별 대입 방식입니다. 현재 여러 실험실에서 전체 게놈의 염기서열 분석, 분석 및 해석 서비스를 제공하고 있습니다.

2010년에 전체 게놈 시퀀싱을 사용하여 장에 여러 개의 신비한 농양이 있는 어린 소년을 구했습니다. 아이는 몇 차례 결장 수술을 받았지만 안도했습니다. 마지막으로, 전체 게놈 서열은 세포자멸사(프로그램된 세포 사멸)를 제어하는 ​​경로의 결함을 밝혀냈습니다. 이 유전적 장애를 극복하기 위해 골수 이식이 사용되어 소년이 치료되었습니다. 그는 전체 게놈 시퀀싱을 사용하여 성공적으로 진단된 최초의 사람이었습니다.

바이러스, 세균, 효모 등의 염기서열이 처음으로 밝혀진 게놈은 다세포 생물의 게놈보다 염기의 수가 적었다. 마우스와 같은 다른 모델 유기체의 게놈(근육), 초파리(초파리 멜라노가스터) 및 선충(Caenorhabditis elegans)이(가) 알려졌습니다. 에서 많은 기초 연구가 수행됩니다. 모델 유기체 정보가 다른 유기체에 적용될 수 있기 때문입니다. 모델 유기체는 모델 유기체가 나타낼 수 있는 다른 종의 생물학적 과정을 이해하기 위한 모델로 연구되는 종입니다. 예를 들어 초파리는 인간과 마찬가지로 알코올을 대사할 수 있으므로 인간의 알코올 민감도 변화를 이해하기 위해 초파리에서 알코올 민감도에 영향을 미치는 유전자가 연구되었습니다. 전체 게놈을 시퀀싱하면 이러한 모델 유기체에 대한 연구 노력에 도움이 됩니다.

그림 2. 많은 기초 연구는 마우스, Mus musculus와 같은 모델 유기체에 대해 수행됩니다. 초파리, Drosophila melanogaster; 선충, Caenorhabditis elegans; 효모, 사카로마이세스 세레비지애(Saccharomyces cerevisiae); 그리고 일반적인 잡초인 Arabidopsis thaliana.

크레딧: "마우스": Florean Fortescuecredit의 작업 수정; "선충류": "snickclunk"/Flickr에 의한 작업 수정; "일반 잡초": USDA, Peggy Greb의 작업 수정; Matt Russell의 스케일 바 데이터

최초의 인간 게놈 서열은 2003년에 발표되었습니다. 전체 게놈의 서열이 꾸준히 증가하여 현재 수백 종의 인간 게놈과 수천 개의 개별 인간 게놈을 포함하고 있습니다.

유전체학 적용

DNA 시퀀싱 및 전체 게놈 시퀀싱 프로젝트, 특히 인간 게놈 프로젝트의 도입으로 DNA 서열 정보의 적용 가능성이 확대되었습니다. 유전체학은 현재 메타유전체학, 약물유전체학, 미토콘드리아 유전체학 등 다양한 분야에서 활용되고 있습니다. 유전체학의 가장 일반적으로 알려진 응용은 질병을 이해하고 치료법을 찾는 것입니다.

개인 수준에서 질병 위험 예측

질병의 위험을 예측하는 것은 개인 수준에서 게놈 분석을 통해 현재 건강한 개인을 선별하고 식별하는 것을 포함합니다. 질병이 발병하기 전에 생활 방식의 변화와 약물에 대한 개입이 권장될 수 있습니다. 그러나 이 접근 방식은 단일 유전자 돌연변이에서 문제가 발생할 때 가장 적합합니다. 이러한 결함은 선진국에서 발견되는 질병의 약 5%에 불과합니다. 심장병과 같은 흔한 질병의 대부분은 다인성 또는 다유전자성으로 2개 이상의 유전자와 식이와 같은 환경적 요인에 의해 결정되는 표현형 특성을 말합니다. 2010년 4월, 스탠포드 대학의 과학자들은 건강한 개인의 게놈 분석을 발표했습니다(스탠포드 대학의 과학자 스티븐 퀘이크(Stephen Quake)는 그의 게놈 서열을 분석했습니다). 분석은 그의 다양한 질병에 대한 그의 성향을 예측했다. 위험 평가는 55가지 다른 의학적 상태에 대한 Quake의 위험 비율을 분석하기 위해 수행되었습니다. 갑작스런 심장마비의 위험이 있는 것으로 보이는 희귀 유전자 돌연변이가 발견되었습니다. 그는 또한 전립선암 발병 위험이 23%, 알츠하이머병 발병 위험이 1.4%로 예측되었습니다. 과학자들은 게놈 데이터를 분석하기 위해 데이터베이스와 여러 출판물을 사용했습니다. 게놈 시퀀싱이 점점 더 저렴해지고 분석 도구가 더 신뢰할 수 있게 되더라도 인구 수준에서 게놈 분석을 둘러싼 윤리적 문제는 해결해야 합니다. 예를 들어, 그러한 데이터를 합법적으로 사용하여 보험료를 더 많이 또는 더 적게 청구하거나 신용 등급에 영향을 미칠 수 있습니까?

게놈 전체 연관성 연구

2005년부터 게놈 전체 연관 연구(GWAS)라는 연구 유형을 수행하는 것이 가능했습니다. GWAS는 질병의 원인이 될 수 있는 단일 염기 다형성(SNP)에서 개인 간의 차이를 식별하는 방법입니다. 이 방법은 게놈 전체에 걸쳐 하나 이상의 유전적 변화에 의해 영향을 받을 수 있는 질병에 특히 적합합니다. 가족력 정보를 이용하여 그러한 질병에 관련된 유전자를 식별하는 것은 매우 어렵습니다. GWAS 방법은 국제 HapMap 프로젝트라고 하는 2002년부터 개발 중인 유전자 데이터베이스에 의존합니다. HapMap 프로젝트는 전 세계에서 수백 명의 개인의 게놈을 시퀀싱하고 SNP 그룹을 식별했습니다. 이 그룹에는 염색체에서 서로 가까이 위치하는 SNP가 포함되므로 재조합을 통해 함께 유지되는 경향이 있습니다. 그룹이 함께 유지된다는 사실은 하나의 마커 SNP를 식별하는 것이 그룹의 모든 SNP를 식별하는 데 필요한 전부라는 것을 의미합니다. 수백만 개의 SNP가 확인되었지만 마커 SNP만 확인하면 되므로 완전한 게놈 염기서열이 없는 다른 개인에서 이를 확인하는 것이 훨씬 쉽습니다.

GWAS의 공통 설계에서는 두 그룹의 개인이 선택됩니다. 한 그룹에는 질병이 있고 다른 그룹에는 질병이 없습니다. 각 그룹의 개인은 두 그룹 간의 차이를 유발하는 교란 변수의 영향을 줄이기 위해 다른 특성에서 일치됩니다. 예를 들어, 두 그룹은 대부분 세계의 다른 지역에서 가져오기 때문에 유전자형이 다를 수 있습니다. 일단 개인이 선택되고 일반적으로 연구를 수행하기 위해 그들의 수는 천 개 이상이면 DNA 샘플이 얻어집니다. DNA는 자동화 시스템을 사용하여 분석하여 두 그룹 간의 특정 SNP 비율의 큰 차이를 식별합니다. 종종 이 연구는 DNA에서 백만 개 이상의 SNP를 검사합니다. GWAS의 결과는 두 가지 방법으로 사용될 수 있습니다. 유전적 차이는 진단되지 않은 개인의 질병에 대한 감수성에 대한 마커로 사용될 수 있으며 식별된 특정 유전자는 질병의 분자 경로 및 잠재적 치료법에 대한 연구의 표적이 될 수 있습니다. 질병과 유전자 연관 발견의 파생물은 개인의 SNP 보체를 기반으로 다양한 질병의 위험 수준을 식별하는 소위 "개인 유전체학"을 제공하는 회사의 형성이었습니다. 이러한 서비스 이면의 과학은 논란의 여지가 있습니다.

GWAS는 유전자와 질병 사이의 연관성을 찾기 때문에 이러한 연구는 특정 질문에 답하기보다는 원인에 대한 다른 연구를 위한 데이터를 제공합니다. 유전자 차이와 질병 사이의 연관성이 반드시 인과 관계가 있음을 의미하지는 않습니다. 그러나 일부 연구는 질병의 유전적 원인에 대한 유용한 정보를 제공했습니다. 예를 들어, 2005년의 세 가지 다른 연구에서는 노화 관련 황반변성이라고 하는 질병을 유발하는 실명과 관련된 신체의 염증 조절에 관여하는 단백질에 대한 유전자를 확인했습니다. 이것은 이 질병의 원인에 대한 연구의 새로운 가능성을 열어주었습니다. 많은 수의 유전자가 GWAS를 사용하여 크론병과 관련이 있는 것으로 확인되었으며 이들 중 일부는 질병의 원인에 대한 새로운 가설적 메커니즘을 제안했습니다.

약물유전체학

약물유전체학 개인의 게놈 서열 정보를 기반으로 약물의 효과와 안전성을 평가하는 것입니다. 개인 유전체 염기서열 정보는 개별 환자의 유전자형을 기반으로 가장 효과적이고 독성이 적은 약물을 처방하는 데 사용할 수 있습니다. 유전자 발현의 변화를 연구하면 약물 존재 시 유전자 전사 프로파일에 대한 정보를 제공할 수 있으며, 이는 독성 효과 가능성의 조기 지표로 사용될 수 있습니다. 예를 들어, 세포 성장과 조절된 세포 사멸에 관여하는 유전자가 교란되면 암세포가 성장할 수 있습니다. 게놈 연구는 또한 약물 독성과 관련된 새로운 유전자를 찾는 데 도움이 될 수 있습니다. 유전자 서명은 완전히 정확하지 않을 수 있지만 병리학적 증상이 발생하기 전에 추가로 테스트할 수 있습니다.

메타유전체학

전통적으로 미생물학은 단일 유형의 세포를 분리하고 실험실에서 배양하는 것을 포함하는 순수한 배양 조건에서 미생물을 가장 잘 연구한다는 관점에서 가르쳐 왔습니다. 미생물은 몇 시간 만에 여러 세대를 거칠 수 있기 때문에 유전자 발현 프로필은 새로운 실험실 환경에 매우 빠르게 적응합니다. 반면에 많은 종들은 고립된 배양에 저항합니다. 대부분의 미생물은 고립된 개체로 살지 않고 생물막으로 알려진 미생물 군집에서 산다. 이러한 모든 이유 때문에 순수 배양이 항상 미생물을 연구하는 가장 좋은 방법은 아닙니다. 메타유전체학 환경 적소에서 성장하고 상호 작용하는 여러 종의 집단 게놈에 대한 연구입니다. Metagenomics는 새로운 종을 보다 신속하게 식별하고 오염 물질이 환경에 미치는 영향을 분석하는 데 사용할 수 있습니다. Metagenomics 기술은 이제 물고기와 같은 고등 진핵 생물의 커뮤니티에도 적용될 수 있습니다.

그림 3. Metagenomics는 환경 적소 내에서 여러 종의 DNA를 분리하는 것을 포함합니다. DNA가 절단되고 시퀀싱되어 여러 종의 전체 게놈 시퀀스가 ​​겹치는 조각의 시퀀스에서 재구성될 수 있습니다.

새로운 바이오 연료의 생성

미생물의 유전체학에 대한 지식은 조류와 시아노박테리아의 바이오 연료를 활용하는 더 나은 방법을 찾는 데 사용됩니다. 오늘날 연료의 주요 공급원은 석탄, 석유, 목재 및 에탄올과 같은 기타 식물 제품입니다. 식물은 재생 가능한 자원이지만 우리 인구의 에너지 수요를 충족시키기 위해 더 많은 대체 재생 가능한 에너지를 찾을 필요가 있습니다. 미생물 세계는 새로운 효소를 암호화하고 새로운 유기 화합물을 생성하는 유전자의 가장 큰 자원 중 하나이며 대부분 미개척 상태입니다. 이 방대한 유전 자원은 새로운 바이오 연료 공급원을 제공할 잠재력을 가지고 있습니다.

그림 4. 재생 가능한 연료는 첫 번째 해군 에너지 포럼에서 해군 선박과 항공기에서 테스트되었습니다.

크레딧: 미 해군 John F. Williams의 작업 수정

미토콘드리아 유전체학

미토콘드리아는 자체 DNA를 포함하는 세포 내 소기관입니다. 미토콘드리아 DNA는 빠른 속도로 돌연변이를 일으켜 진화 관계를 연구하는 데 자주 사용됩니다. 미토콘드리아 게놈 연구를 흥미롭게 만드는 또 다른 특징은 대부분의 다세포 유기체에서 미토콘드리아 DNA가 수정 과정에서 어머니로부터 전달된다는 것입니다. 이러한 이유로 미토콘드리아 유전체학은 종종 족보를 추적하는 데 사용됩니다.

법의학 분석의 유전체학

범죄 현장에서 발견된 DNA 샘플에서 얻은 정보와 단서는 법정에서 증거로 활용되고 있으며, 유전자 마커는 법의학 분석에 활용되고 있습니다. 게놈 분석도 이 분야에서 유용하게 되었습니다. 2001년 법의학에서 유전체학의 첫 사용이 발표되었습니다. 미 우정사업본부를 통해 운송된 미스터리한 탄저병 사건을 해결하기 위한 학계와 FBI의 협업이었다. 탄저균은 감염성 가루로 만들어져 뉴스 매체와 두 명의 미국 상원의원에게 우송되었습니다. 이 가루는 편지를 열거나 취급하는 관리 직원과 우체국 직원을 감염시켰습니다. 5명이 사망하고 17명이 박테리아에 감염되었습니다. 연구자들은 미생물 유전체학을 사용하여 특정 탄저병 균주가 모든 우편물에 사용되었음을 확인했습니다. 결국, 출처는 메릴랜드에 있는 국립 생물방어 연구소의 과학자에게 추적되었습니다.

그림 5. 탄저균은 탄저병을 일으키는 유기체입니다.

크레딧: CDC의 작업 수정 Matt Russell의 스케일 바 데이터

농업의 유전체학

유전체학은 과학 연구와 관련된 시행착오를 어느 정도 줄일 수 있으며, 이는 농업에서 수확량의 질과 양을 향상시킬 수 있습니다. 형질을 유전자 또는 유전자 서명에 연결하면 작물 육종을 개선하여 가장 바람직한 품질의 잡종을 생성하는 데 도움이 됩니다. 과학자들은 게놈 데이터를 사용하여 바람직한 형질을 식별한 다음 이러한 형질을 다른 유기체에 전달하여 이전 모듈에서 설명한 대로 새로운 유전자 변형 유기체를 만듭니다. 과학자들은 게놈이 어떻게 농업 생산의 질과 양을 향상시킬 수 있는지 발견하고 있습니다. 예를 들어, 과학자들은 가뭄에 민감한 작물을 건기에 더 잘 견디도록 하는 것과 같이 유용한 제품을 만들거나 기존 제품을 향상시키기 위해 바람직한 특성을 사용할 수 있습니다.

그림 6. 형질전환 농업 식물은 질병에 저항하도록 만들 수 있습니다. 이 형질전환 자두는 자두 바이러스에 내성이 있습니다.

크레딧: Scott Bauer, USDA ARS

단백질체학

단백질은 유전자에 의해 암호화된 기능을 수행하는 유전자의 최종 산물입니다. 단백질은 아미노산으로 구성되어 있으며 세포에서 중요한 역할을 합니다. 모든 효소(리보자임을 제외)는 단백질이며 반응 속도에 영향을 미치는 촉매 역할을 합니다. 단백질은 또한 조절 분자이며 일부는 호르몬입니다. 헤모글로빈과 같은 수송 단백질은 산소를 다양한 기관으로 수송하는 데 도움이 됩니다. 이물질을 방어하는 항체도 단백질입니다. 질병 상태에서 단백질 기능은 유전적 수준의 변화나 특정 단백질에 대한 직접적인 영향으로 인해 손상될 수 있습니다.

프로테옴은 세포 유형에 의해 생성되는 전체 단백질 세트입니다. 유전자는 mRNA를 암호화하고 mRNA는 단백질을 암호화하기 때문에 프로테옴은 게놈 지식을 사용하여 연구할 수 있습니다. 프로테옴의 기능에 대한 연구는 단백질체학. Proteomics는 유전체학을 보완하며 과학자들이 유전자에 기반한 가설을 테스트하고자 할 때 유용합니다. 다세포 유기체의 모든 세포는 동일한 유전자 세트를 가지고 있지만 다른 조직에서 생성되는 단백질 세트는 다르고 유전자 발현에 의존합니다. 따라서 게놈은 일정하지만 프로테옴은 유기체 내에서 다양하고 역동적입니다. 또한, RNA는 대안적으로 접합될 수 있으며(새로운 조합과 새로운 단백질을 생성하기 위해 절단 및 붙여넣기), 번역 후에 많은 단백질이 변형됩니다. 게놈이 청사진을 제공하지만 최종 아키텍처는 프로테옴을 생성하는 이벤트의 진행을 변경할 수 있는 여러 요인에 따라 달라집니다.

특정 질병으로 고통받는 환자의 게놈과 프로테옴은 질병의 유전적 기초를 이해하기 위해 연구되고 있습니다. proteomic 접근법으로 연구되고 있는 가장 두드러진 질병은 암입니다(그림 7). Proteomic 접근법은 암의 스크리닝 및 조기 발견을 개선하기 위해 사용되고 있습니다. 이것은 발현이 질병 과정에 의해 영향을 받는 단백질을 식별함으로써 달성됩니다. 개별 단백질을 바이오마커, 반면에 발현 수준이 변경된 단백질 세트는 단백질 서명. 바이오마커나 단백질 시그니처가 암의 조기 검진 및 발견 후보로 유용하기 위해서는 땀, 혈액, 소변과 같은 체액으로 분비되어야 비침습적 대규모 검진이 가능하다. .

암의 조기 발견을 위해 바이오마커를 사용하는 현재의 문제는 높은 위음성 결과 비율입니다. 위음성 결과는 양성이어야 하는 음성 검사 결과입니다. 다시 말해, 많은 암 사례가 감지되지 않아 바이오마커를 신뢰할 수 없게 만듭니다. 암 검출에 사용되는 단백질 바이오마커의 몇 가지 예는 난소암의 경우 CA-125이고 전립선암의 경우 PSA입니다. 단백질 서명은 암 세포를 감지하는 바이오마커보다 더 신뢰할 수 있습니다. Proteomics는 또한 개인이 특정 약물에 반응할지 여부와 개인이 가질 수 있는 부작용에 대한 예측을 포함하는 개별화된 치료 계획을 개발하는 데 사용됩니다. Proteomics는 또한 질병의 재발 가능성을 예측하는 데 사용됩니다.

그림 7. 이 기계는 정확한 암 예후를 내리기 위해 특정 암을 식별하는 프로테옴 패턴 분석을 준비하고 있습니다.

크레딧: Dorie Hightower, NCI, NIH

국립 암 연구소는 암의 발견 및 치료를 개선하기 위한 프로그램을 개발했습니다. Clinical Proteomic Technologies for Cancer 및 Early Detection Research Network는 다양한 유형의 암에 특정한 단백질 특징을 식별하기 위한 노력입니다. Biomedical Proteomics Program은 단백질 특징을 식별하고 암 환자를 위한 효과적인 치료법을 설계하도록 설계되었습니다.

섹션 요약

게놈 매핑은 전 세계의 실험실에서 가져온 정보 조각으로 크고 복잡한 퍼즐을 푸는 것과 유사합니다. 유전자 지도는 게놈 내 유전자의 위치에 대한 개요를 제공하고 감수 분열 동안의 재조합 빈도를 기반으로 유전자와 유전자 마커 사이의 거리를 추정합니다. 물리적 지도는 유전자 간의 물리적 거리에 대한 자세한 정보를 제공합니다. 가장 자세한 정보는 시퀀스 매핑을 통해 얻을 수 있습니다. 모든 매핑 및 시퀀싱 소스의 정보는 전체 게놈을 연구하기 위해 결합됩니다.

전체 게놈 시퀀싱은 유전 질환을 치료하는 데 사용할 수 있는 최신 리소스입니다. 일부 의사들은 생명을 구하기 위해 전체 게놈 시퀀싱을 사용하고 있습니다. 유전체학은 바이오 연료 개발, 농업, 제약 및 오염 제어를 포함한 많은 산업 응용 분야를 가지고 있습니다.

상상력은 유전체학의 적용 가능성에 대한 유일한 장벽입니다. 유전체학은 대부분의 생물학 분야에 적용되고 있습니다. 개인별 맞춤의료, 질병위험도 예측, 임상시험 전 약물상호작용 연구, 실험실이 아닌 환경 내 미생물 연구 등에 활용할 수 있다. 또한 새로운 바이오 연료의 생성, 미토콘드리아를 이용한 계보 평가, 법의학의 발전, 농업의 개선에도 적용되고 있습니다.

Proteomics는 특정 환경 조건에서 주어진 유형의 세포에 의해 발현되는 전체 단백질 세트에 대한 연구입니다. 다세포 유기체에서 다른 세포 유형은 다른 프로테옴을 가지며 이는 환경의 변화에 ​​따라 달라집니다. 게놈과 달리 프로테옴은 역동적이고 일정한 흐름을 유지하므로 게놈만 아는 것보다 더 복잡하고 유용합니다.


유전학, 유전체학 및 시스템 생물학

유전학, 유전체학 및 시스템 생물학 위원회(GGSB)는 여러 학부에서 온 60명 이상의 생물학자를 한데 모으는 학제간 박사 학위 수여 프로그램입니다. GGSB 프로그램은 기초 ​​및 응용 생물 의학 연구 및 교육 분야에서 독립적인 과학자로서의 경력을 위해 박사 학자를 양성하는 것을 목표로 합니다. GGSB는 유전학 박사 학위로 이어지는 기초 연구 프로그램을 제공합니다. 우리의 박사 과정 교육 프로그램은 현대 유전 분석의 기초와 복잡한 시스템의 맥락에서 생물학적 문제를 공식화하고 해결하는 현재 방법에 대한 교육을 결합합니다. 이러한 시스템은 생리학적, 발달적, 진화적 맥락에서 연구됩니다. GGSB의 60명 이상의 교육 교수진은 University of Chicago의 다양한 부서를 대표합니다. 생물 과학 부문에 기초 과학과 임상 과학이 모두 존재함으로써 교육 및 연구에 대한 GGSB의 광범위한 학제 ​​간 접근 방식이 향상됩니다. GGSB 프로그램은 개인의 필요를 충족시키기 위해 프로그램을 유연하게 설계할 수 있는 엄격한 고품질 교육을 추구할 수 있는 흥미진진한 환경을 제공합니다. 우리의 목표는 학생들이 연구 훈련에서 연구 독립으로 원활하게 발전할 수 있도록 지적으로 자극적이고 협력적이며 지원적인 환경을 제공하는 것입니다.


게놈이란 무엇입니까?

유기체의 완전한 DNA 세트를 게놈이라고 합니다. 신체의 거의 모든 단일 세포에는 인간 게놈을 구성하는 약 30억 개의 DNA 염기쌍 또는 문자의 완전한 사본이 들어 있습니다.

4글자로 된 DNA는 인체 전체를 구성하는 데 필요한 정보를 담고 있습니다. 유전자는 전통적으로 특정 단백질 또는 단백질 세트를 만들기 위한 지침을 전달하는 DNA 단위를 나타냅니다. 인간 게놈에 있는 약 20,000~25,000개의 유전자 각각은 평균 3개의 단백질을 암호화합니다.

인간 세포의 핵에 채워진 23쌍의 염색체에 위치한 유전자는 효소와 메신저 분자의 도움으로 단백질 생산을 지시합니다. 특히, 효소는 유전자의 DNA에 있는 정보를 mRNA(messenger ribonucleic acid)라는 분자로 복사합니다. mRNA는 핵에서 나와 세포의 세포질로 이동합니다. 여기에서 mRNA는 리보솜이라는 작은 분자 기계에 의해 읽혀지고 정보는 아미노산이라는 작은 분자를 올바른 순서로 연결하여 특정 단백질을 형성하는 데 사용됩니다.

단백질은 장기 및 조직과 같은 신체 구조를 구성할 뿐만 아니라 화학 반응을 제어하고 세포 간에 신호를 전달합니다. 세포의 DNA가 돌연변이되면 비정상적인 단백질이 생성되어 신체의 정상적인 과정을 방해하고 암과 같은 질병을 유발할 수 있습니다.

유기체의 완전한 DNA 세트를 게놈이라고 합니다. 신체의 거의 모든 단일 세포에는 인간 게놈을 구성하는 약 30억 개의 DNA 염기쌍 또는 문자의 완전한 사본이 들어 있습니다.

네 글자로 된 DNA는 인체 전체를 구성하는 데 필요한 정보를 담고 있습니다. 유전자는 전통적으로 특정 단백질 또는 단백질 세트를 만들기 위한 지침을 전달하는 DNA 단위를 나타냅니다. 인간 게놈에서 추정되는 20,000~25,000개의 유전자 각각은 평균 3개의 단백질을 암호화합니다.

인간 세포의 핵에 채워진 23쌍의 염색체에 위치한 유전자는 효소와 메신저 분자의 도움으로 단백질 생산을 지시합니다. 특히, 효소는 유전자 DNA의 정보를 mRNA(messenger ribonucleic acid)라는 분자로 복사합니다. mRNA는 핵에서 나와 세포의 세포질로 이동합니다. 여기에서 mRNA는 리보솜이라는 작은 분자 기계에 의해 읽혀지고 정보는 아미노산이라는 작은 분자를 올바른 순서로 연결하여 특정 단백질을 형성하는 데 사용됩니다.

단백질은 장기 및 조직과 같은 신체 구조를 구성할 뿐만 아니라 화학 반응을 제어하고 세포 간에 신호를 전달합니다. 세포의 DNA가 돌연변이되면 비정상적인 단백질이 생성되어 신체의 정상적인 과정을 방해하고 암과 같은 질병을 유발할 수 있습니다.


이 지점의 목표는 유전 및 게놈 기술에서 파생된 연구 결과와 기회가 인간 질병의 개선된 진단, 치료 및 예방으로 번역될 수 있음을 입증하는 것입니다. NHGRI 교내 실험실, NIH 임상 센터 및 NIH 전반에 걸친 교내 협력의 우수한 자원을 사용하여 지부는 인간 질병 연구에 최신 게놈 및 유전 기술을 도입하는 기본, 중개 및 임상 연구에 참여하고 있습니다.

우리 조사관은 새로운 번역 접근 방식과 고급 기술을 개발하고 신속하게 평가합니다. 또한 NIH Clinical Center, NIH Intramural Sequencing Center 및 NIH Chemical Genomics Center와의 협력은 단일 연구자 실험실의 범위를 확장하는 프로젝트를 지원합니다. NHGRI 핵심 시설은 모든 지사 연구 노력의 똑같이 중요한 구성 요소이며, 우리 조사관이 최첨단 생물 정보학, 유전자 변형 동물, 유세포 분석, 게놈 및 세포 유전학 기술에 대한 액세스를 제공합니다. 이러한 자원을 통해 우리 조사관은 면역 결핍 유전자 요법에 대한 임상 시험 및 대사 장애에 대한 유전자 요법의 전임상 개발을 개발할 수 있었습니다. 또한, 우리 연구자들은 유전 질환 및 악성 종양을 치료하기 위해 질병 유전자를 발견하고 소분자를 식별했습니다.

연수생의 미래 경력을 위한 멘토링과 준비는 지부의 최우선 과제입니다. 지점 교수진은 NHGRI 및 NIH 교내 교육 및 세미나 프로그램과 통합되고 확장된 연수생을 위한 광범위한 학습 경험을 제공합니다. 우리 조사관은 봉사 활동 및 학습 기회에 참여하고, 여름 인턴십을 제공하고, 대표성이 낮은 그룹의 학생들에게 멘토링을 제공합니다.

이 지점의 목표는 유전 및 게놈 기술에서 파생된 연구 결과와 기회가 인간 질병의 개선된 진단, 치료 및 예방으로 번역될 수 있음을 입증하는 것입니다. NHGRI 교내 실험실, NIH 임상 센터 및 NIH 전반에 걸친 교내 협력의 우수한 자원을 사용하여 지부는 인간 질병 연구에 최신 게놈 및 유전 기술을 도입하는 기본, 중개 및 임상 연구에 참여하고 있습니다.

우리 조사관은 새로운 번역 접근 방식과 고급 기술을 개발하고 신속하게 평가합니다. 또한 NIH Clinical Center, NIH Intramural Sequencing Center 및 NIH Chemical Genomics Center와의 협력은 단일 연구자 실험실의 범위를 확장하는 프로젝트를 지원합니다. NHGRI 핵심 시설은 모든 지사 연구 노력의 똑같이 중요한 구성 요소이며, 우리 조사관이 최첨단 생물 정보학, 유전자 변형 동물, 유세포 분석, 게놈 및 세포 유전학 기술에 대한 액세스를 제공합니다. 이러한 자원을 통해 우리 조사관은 면역 결핍 유전자 요법에 대한 임상 시험 및 대사 장애에 대한 유전자 요법의 전임상 개발을 개발할 수 있었습니다. 또한, 우리 연구자들은 유전 질환 및 악성 종양을 치료하기 위해 질병 유전자를 발견하고 소분자를 식별했습니다.

연수생의 미래 경력을 위한 멘토링과 준비는 지부의 최우선 과제입니다. 지점 교수진은 NHGRI 및 NIH 교내 교육 및 세미나 프로그램과 통합되고 확장된 연수생을 위한 광범위한 학습 경험을 제공합니다. 우리 조사관은 봉사 활동 및 학습 기회에 참여하고, 여름 인턴십을 제공하고, 대표성이 낮은 그룹의 학생들에게 멘토링을 제공합니다.


유전체 및 시스템 생물학 센터

NS 유전체시스템생물학센터, 62,000제곱피트의 최첨단 "과학의 허브"에 위치한 이 캠퍼스는 NYU 워싱턴 스퀘어 캠퍼스의 심장부에 있습니다. 역사적인 그리니치 빌리지 외관 너머에는 교수, 연구원, 학생을 포함한 과학자들이 연구 및 교육 분야에서 게놈 및 시스템 생물학의 놀라운 잠재력을 활용하기 위해 상호 작용하는 개방형 상호 연결된 최첨단 "로프트 연구소"가 있습니다.

센터의 연구 프로그램은 유전학 및 시스템 생물학 연구를 생물학의 선구자 시대의 다음 개척지로 포용합니다. 여기에는 다음의 결합된 기술이 포함됩니다. 게놈, 계산적인, 그리고 진화생물학자들 센터에서 일하고 공부하는 사람. 교수진은 또한 Courant Institute of Mathematical Sciences, Faculty of Arts and Sciences의 연구원들과 협력합니다. 물리학과 그리고 화학, NYU 의과대학, NYU 폴리테크닉 공과대학, NYU 글로벌 공중보건 대학, NYU 데이터 과학 센터, NYU 도시 과학 및 발전 센터, 그리고 다른 주요 뉴욕 기관 및 전 세계의 연구원들과 함께합니다. 이러한 내부 및 외부 협력으로 인한 지적 시너지 효과를 통해 유전체학과 시스템 생물학에 대한 고유한 접근 방식을 개발할 수 있습니다.

생명 나무의 모든 주요 가지에서 나온 유기체와 함께 연구하면서 센터의 연구원들은 게놈이 암호화하는 방식을 설명합니다. 조절 유전자 네트워크, 변경 사항에 응답 환경 또는 동안 개발, 어떻게 유전자 진화하다, 그리고 이것이 어떻게 생성되는지 다양성 종 내에서 그리고 종을 넘어. 이러한 원칙은 다음의 글로벌 질문에 적용되고 있습니다. 인간의 건강, 식품 지속 가능성, 바이오 에너지, 그리고 환경.


유전체학

유전체학 의 개발을 설명하는 포럼입니다. 게놈 규모의 기술 생물학적 조사의 모든 영역에 대한 적용.

그 이름을 딴 분야와 함께 발전해 온 저널로서, 유전체학 근본적인 문제를 해결하는 최첨단 방법의 개발 및 적용에 중점을 둡니다.

유전체학 의 개발을 설명하는 포럼입니다. 게놈 규모의 기술 생물학적 조사의 모든 영역에 대한 적용.

그 이름을 딴 분야와 함께 발전해 온 저널로서, 유전체학 광범위한 청중이 관심을 가질 수 있는 근본적인 질문을 해결하는 최첨단 방법의 개발 및 적용에 중점을 둡니다. 우리의 목표는 최고 품질의 연구를 출판하고 저자에게 우리의 범위에 속하는 원고에 대해 신속하고 공정하며 정확한 검토와 출판을 제공하는 것입니다. Genomics 범위 내의 주제에는 다음이 포함되지만 이에 국한되지는 않습니다.

  • 게놈 프로젝트, 게놈 시퀀싱, 게놈 기술 및 새로운 전략을 포함한 게놈. 단일 미토콘드리아, 엽록체 및 세균 균주 변이체 게놈에 대한 단순한 보고는 더 이상 적합하지 않습니다.
  • 전사 프로파일링, mRNA 분석, microRNA 분석, 기존 및 새로 등장하는 기술(예: 디지털 유전자 발현)을 사용한 비코딩 및 기타 RNA 분석을 포함한 기능 유전체학. 기존 염기서열 데이터만을 분석하는 원고는 새로운 염기서열 데이터를 추가하거나 새로운 분석 알고리즘을 도입하지 않는 한 더 이상 적합하지 않습니다. 알고리즘은 웹 페이지를 통해 또는 코드로 공개적으로 제공되어야 합니다.
  • 계통학을 포함한 진화 및 비교 유전체학.
  • 게놈 기술 및 방법론 개발, 현장 및 신흥 기술에 상당한 영향을 미칠 수 있는 새롭고 흥미로운 응용 프로그램에 중점을 둡니다.
  • 통합 방법, 네트워크 생물학, 새로운 도구 및 기술 개발을 포함한 컴퓨터 생물학, 생물정보학 및 생물통계학.
  • 복잡한 유전자 연구, 집단 유전체학, 연관 연구, 구조적 변이, 유전자-환경 상호작용을 포함한 게놈 규모의 현대 유전학o DNA 메틸화, 히스톤 변형, 염색질 구조, 각인 및 염색질 리모델링을 포함한 후성유전체학.
  • DNA 요소, 유전자좌 제어 영역, 절연체, 인핸서, 소음기 및 유전자 조절 메커니즘을 포함한 게놈 조절 분석.
  • 질병 발병 기전과 메타 게놈, 유전자 및 게놈 서열 진화의 모드 및 템포를 포함한 유전적 요인과의 관계를 이해하기 위한 게놈 접근법.
  • 의료 유전체학, 개인 유전체학 및 인간 건강에 대한 기타 응용 프로그램.
  • 광범위한 청중이 관심을 가질 수 있는 모델 유기체에 게놈 기술을 적용합니다.
  • 3개 이상의 생물학적 복제가 없는 RNA-seq 실험은 차등 발현 기반 기사에 대해 허용되지 않습니다.
  • 복잡하고 동적이고 높은 처리량의 게놈 데이터 세트에서 새로운 통찰력을 추론하는 데 도움이 되는 컴퓨터 시스템 생물학, 이산 및 연속 모델링 및 인공 지능에 대한 최첨단 연구를 포함한 시스템 게놈.

유전체학 주로 독창적인 연구 논문을 출판하지만 전체 길이 및 미니 리뷰에 대한 제안도 환영합니다. 모든 제출물 유전체학 엄격한 피어 리뷰의 대상이 되며 우리의 목표는 제출된 원고의 상위 25-30%만 수락하는 것입니다. 심사 제안이나 저널의 범위나 게재 가능한 원고의 적합성에 관한 문의 사항은 편집실로 연락주시기 바랍니다.


공간 생물학: 유전체학의 새로운 차원

조시 류 박사
공동 설립자 및 최고 기술 책임자
리버스 바이오시스템즈

줄리아 케네디-달링, 박사
코덱스 R&D 책임자
아코야 바이오사이언스

복 요니
부사장,
시약 R&D, Vizgen

방송 날짜: 2021년 6월 16일
시간: 오후 2시(동부 표준시)

유전자 발현을 분석하든 단백질 생산을 분석하든, 흥미롭고 새로운 공간 생물학(또는 공간 오믹스) 분야는 기존의 단일 세포 유전체학을 뛰어넘습니다. 어떤 유전자와 단백질이 발현되는지 알려주는 것 외에도 공간 생물학은 그것들이 어디에 위치하는지 알려줍니다. 이 공간 정보는 SARS-CoV-2에 감염된 폐와 같은 복잡한 환경의 생물학을 밝히거나 암 종양과 미세 환경 간의 복잡성을 구별할 때 매우 중요합니다.

PCR의 발명가인 Kary Mullis는 "과학은 매년 새로운 기적의 진실과 눈부신 장치를 지속적으로 생산한다"고 말했습니다. 사실이지만, 과학 연구에 혁명을 일으킨 PCR 및 차세대 시퀀싱과 같은 실험실 주류의 중요성에 필적할 수 있는 신기술은 거의 없습니다. 그러나 공간 생물학은 이러한 판도를 바꿀 엄청난 가능성을 보여줍니다.

이 GEN Live 에피소드에서 우리는 젊은 공간 회사의 팀 리더가 우리와 함께 "공간" 생물학의 새로운 지평, 이 분야가 단기간에 얼마나 발전했는지, 미래를 약속하는 발전에 대해 논의하게 된 것을 기쁘게 생각합니다. .

손님은 다음과 같습니다:
Rebus Biosystems의 공동 창립자이자 최고 기술 책임자인 Josh Ryu 박사
Julia Kennedy-Darling, PhD, Akoya Biosciences, CODEX R&D 책임자
Yoni Bock, Vizgen 시약 R&D 담당 부사장

공동 주최자:
Julianna LeMieux, 박사
케빈 데이비스 박사
알렉스 필피디스
존 스털링


GCB에 오신 것을 환영합니다!

Genomics and Computational Biology(GCB) 대학원 그룹의 사명은 건강과 질병의 생물학적 기초에 대한 통합적이고 깊은 이해를 바탕으로 차세대 양적 과학자를 양성하는 것입니다.

  • 학생들에게 전산 및 실험 유전체학의 실제 경험과 함께 생물 및 양적 과학의 광범위한 기초를 제공하는 포괄적인 교육 프로그램을 관리합니다.
  • 교과 과정, 세미나, 수련회 및 방문 과학자와의 상호 작용을 통해 연수생에게 지식의 기초를 제공합니다.
  • Penn 게놈 및 컴퓨터 생물학 커뮤니티의 매우 역동적이고 협력적인 분위기를 연수생에게 소개합니다.

다가오는 GCB 이벤트

@UPennGCB의 최신 소식

RT @moorejh: 저는 @penn에서 새로운 생물정보학 박사후 연구원을 모집하여 게놈 an&hellip https://t.co/Mj4guX0AjD에 기계 학습 방법을 개발하고 적용하고 있습니다.

RT @autobencoder: 컴퓨터 생물학 박사 과정에 지원할 생각이신가요? 인 사람을 알고 있습니까? 그렇다면 t&hellip https://t.co/yjtGineHpg

University of Pennsylvania의 이사(©) | 지원되는 브라우저에서 사이트를 가장 잘 볼 수 있습니다. | 접근성 문제 보고 및 도움 받기 | 개인정보 보호정책 | 사이트 디자인: DART 웹 팀.


내용물

기능 유전체학을 이해하기 위해서는 먼저 기능을 정의하는 것이 중요합니다. 그들의 논문에서 [1] Graur et al. 두 가지 가능한 방법으로 기능을 정의하십시오. 이것은 "선택된 효과"와 "인과적 역할"입니다. "선택된 효과" 기능은 형질(DNA, RNA, 단백질 등)이 선택되는 기능을 나타냅니다. "인과적 역할" 기능은 형질이 충분하고 필요한 기능을 말합니다. 기능 유전체학은 일반적으로 기능의 "인과적 역할" 정의를 테스트합니다.

기능유전체학의 목표는 유전자나 단백질, 결국 게놈의 모든 구성요소의 기능을 이해하는 것입니다. 기능 유전체학이라는 용어는 종종 많은 것을 지칭하는 데 사용됩니다. 기술적 접근 유기체를 연구하기 위해 유전자와 단백질, "각각의 모든 유전자 산물의 생화학적, 세포 및/또는 생리학적 특성"[2]을 포함하는 반면 일부 저자는 다음 연구를 포함합니다. 비유전자 요소 그들의 정의에서. [3] 기능 유전체학에는 자연 유전 적 변이 시간이 지남에 따라 (유기체의 발달과 같은) 또는 우주 (예: 신체 부위) 뿐만 아니라 돌연변이와 같은 기능적 장애.

기능 유전체학의 약속은 유기체의 동적 특성에 대한 이해로 유전체 및 단백질 지식을 생성하고 합성하는 것입니다. 이것은 잠재적으로 단일 유전자 연구와 비교하여 게놈이 기능을 지정하는 방법에 대한 보다 완전한 그림을 제공할 수 있습니다. 기능 유전체학 데이터의 통합은 종종 시스템 생물학 접근 방식의 일부입니다.

기능 유전체학에는 돌연변이 및 다형성(예: 단일 염기 다형성(SNP) 분석)과 같은 유전체 자체의 기능 관련 측면과 분자 활성 측정이 포함됩니다. 후자는 transcriptomics(유전자 발현), proteomics(단백질 생산) 및 metabolomics와 같은 다수의 "-omics"로 구성됩니다. 기능 유전체학은 생물학적 샘플 내에서 mRNA 또는 단백질과 같은 많은 또는 모든 유전자 산물의 풍부함을 측정하기 위해 주로 다중 기술을 사용합니다. 보다 집중된 기능적 유전체학 접근법은 한 유전자의 모든 변이체의 기능을 테스트하고 활성 판독으로 시퀀싱을 사용하여 돌연변이체의 효과를 정량화할 수 있습니다. 이러한 측정 양식은 다양한 생물학적 과정을 정량화하고 유전자 및 단백질 기능 및 상호 작용에 대한 이해를 향상시키기 위해 노력합니다.

DNA 수준에서

유전적 상호작용 매핑

Systematic pairwise deletion of genes or inhibition of gene expression can be used to identify genes with related function, even if they do not interact physically. Epistasis refers to the fact that effects for two different gene knockouts may not be additive that is, the phenotype that results when two genes are inhibited may be different from the sum of the effects of single knockouts.

DNA/Protein interactions Edit

Proteins formed by the translation of the mRNA (messenger RNA, a coded information from DNA for protein synthesis) play a major role in regulating gene expression. To understand how they regulate gene expression it is necessary to identify DNA sequences that they interact with. Techniques have been developed to identify sites of DNA-protein interactions. These include ChIP-sequencing, CUT&RUN sequencing and Calling Cards. [4]

DNA accessibility assays Edit

Assays have been developed to identify regions of the genome that are accessible. These regions of open chromatin are candidate regulatory regions. These assays include ATAC-seq, DNase-Seq and FAIRE-Seq.

At the RNA level Edit

Microarrays Edit

Microarrays measure the amount of mRNA in a sample that corresponds to a given gene or probe DNA sequence. Probe sequences are immobilized on a solid surface and allowed to hybridize with fluorescently labeled “target” mRNA. The intensity of fluorescence of a spot is proportional to the amount of target sequence that has hybridized to that spot, and therefore to the abundance of that mRNA sequence in the sample. Microarrays allow for identification of candidate genes involved in a given process based on variation between transcript levels for different conditions and shared expression patterns with genes of known function.

SAGE Edit

Serial analysis of gene expression (SAGE) is an alternate method of analysis based on RNA sequencing rather than hybridization. SAGE relies on the sequencing of 10–17 base pair tags which are unique to each gene. These tags are produced from poly-A mRNA and ligated end-to-end before sequencing. SAGE gives an unbiased measurement of the number of transcripts per cell, since it does not depend on prior knowledge of what transcripts to study (as microarrays do).

RNA sequencing Edit

RNA sequencing has taken over microarray and SAGE technology in recent years, as noted in 2016, and has become the most efficient way to study transcription and gene expression. This is typically done by next-generation sequencing. [5]

A subset of sequenced RNAs are small RNAs, a class of non-coding RNA molecules that are key regulators of transcriptional and post-transcriptional gene silencing, or RNA silencing. Next generation sequencing is the gold standard tool for non-coding RNA discovery, profiling and expression analysis.

Massively Parallel Reporter Assays (MPRAs) Edit

Massively parallel reporter assays is a technology to test the cis-regulatory activity of DNA sequences. [6] [7] MPRAs use a plasmid with a synthetic cis-regulatory element upstream of a promoter driving a synthetic gene such as Green Fluorescent Protein. A library of cis-regulatory elements is usually tested using MPRAs, a library can contain from hundreds to thousands of cis-regulatory elements. The cis-regulatory activity of the elements is assayed by using the downstream reporter activity. The activity of all the library members is assayed in parallel using barcodes for each cis-regulatory element. One limitation of MPRAs is that the activity is assayed on a plasmid and may not capture all aspects of gene regulation observed in the genome.

STARR-seq Edit

STARR-seq is a technique similar to MPRAs to assay enhancer activity of randomly sheared genomic fragments. In the original publication, [8] randomly sheared fragments of the Drosophila genome were placed downstream of a minimal promoter. Candidate enhancers amongst the randomly sheared fragments will transcribe themselves using the minimal promoter. By using sequencing as a readout and controlling for input amounts of each sequence the strength of putative enhancers are assayed by this method.

Perturb-seq Edit

Perturb-seq couples CRISPR mediated gene knockdowns with single-cell gene expression. Linear models are used to calculate the effect of the knockdown of a single gene on the expression of multiple genes.

At the protein level Edit

Yeast two-hybrid system Edit

A yeast two-hybrid screening (Y2H) tests a "bait" protein against many potential interacting proteins ("prey") to identify physical protein–protein interactions. This system is based on a transcription factor, originally GAL4, [9] whose separate DNA-binding and transcription activation domains are both required in order for the protein to cause transcription of a reporter gene. In a Y2H screen, the "bait" protein is fused to the binding domain of GAL4, and a library of potential "prey" (interacting) proteins is recombinantly expressed in a vector with the activation domain. In vivo interaction of bait and prey proteins in a yeast cell brings the activation and binding domains of GAL4 close enough together to result in expression of a reporter gene. It is also possible to systematically test a library of bait proteins against a library of prey proteins to identify all possible interactions in a cell.

AP/MS Edit

Affinity purification and mass spectrometry (AP/MS) is able to identify proteins that interact with one another in complexes. Complexes of proteins are allowed to form around a particular “bait” protein. The bait protein is identified using an antibody or a recombinant tag which allows it to be extracted along with any proteins that have formed a complex with it. The proteins are then digested into short peptide fragments and mass spectrometry is used to identify the proteins based on the mass-to-charge ratios of those fragments.

Deep mutational scanning Edit

In deep mutational scanning every possible amino acid change in a given protein is first synthesized. The activity of each of these protein variants is assayed in parallel using barcodes for each variant. By comparing the activity to the wild-type protein, the effect of each mutation is identified. While it is possible to assay every possible single amino-acid change due to combinatorics two or more concurrent mutations are hard to test. Deep mutational scanning experiments have also been used to infer protein structure and protein-protein interactions.

Loss-of-function techniques Edit

Mutagenesis Edit

Gene function can be investigated by systematically “knocking out” genes one by one. This is done by either deletion or disruption of function (such as by insertional mutagenesis) and the resulting organisms are screened for phenotypes that provide clues to the function of the disrupted gene*

RNAi Edit

RNA interference (RNAi) methods can be used to transiently silence or knock down gene expression using

20 base-pair double-stranded RNA typically delivered by transfection of synthetic

20-mer short-interfering RNA molecules (siRNAs) or by virally encoded short-hairpin RNAs (shRNAs). RNAi screens, typically performed in cell culture-based assays or experimental organisms (such as C. 엘레간스) can be used to systematically disrupt nearly every gene in a genome or subsets of genes (sub-genomes) possible functions of disrupted genes can be assigned based on observed phenotypes.

CRISPR screens Edit

CRISPR-Cas9 has been used to delete genes in a multiplexed manner in cell-lines. Quantifying the amount of guide-RNAs for each gene before and after the experiment can point towards essential genes. If a guide-RNA disrupts an essential gene it will lead to the loss of that cell and hence there will be a depletion of that particular guide-RNA after the screen. In a recent CRISPR-cas9 experiment in mammalian cell-lines, around 2000 genes were found to be essential in multiple cell-lines. [11] [12] Some of these genes were essential in only one cell-line. Most of genes are part of multi-protein complexes. This approach can be used to identify synthetic lethality by using the appropriate genetic background. CRISPRi and CRISPRa enable loss-of-function and gain-of-function screens in a similar manner. CRISPRi identified

2100 essential genes in the K562 cell-line. [13] [14] CRISPR deletion screens have also been used to identify potential regulatory elements of a gene. For example, a technique called ScanDel was published which attempted this approach. The authors deleted regions outside a gene of interest(HPRT1 involved in a Mendelian disorder) in an attempt to identify regulatory elements of this gene. [15] Gassperini et al. did not identify any distal regulatory elements for HPRT1 using this approach, however such approaches can be extended to other genes of interest.

Functional annotations for genes Edit

Genome annotation Edit

Putative genes can be identified by scanning a genome for regions likely to encode proteins, based on characteristics such as long open reading frames, transcriptional initiation sequences, and polyadenylation sites. A sequence identified as a putative gene must be confirmed by further evidence, such as similarity to cDNA or EST sequences from the same organism, similarity of the predicted protein sequence to known proteins, association with promoter sequences, or evidence that mutating the sequence produces an observable phenotype.

Rosetta stone approach Edit

The Rosetta stone approach is a computational method for de-novo protein function prediction. It is based on the hypothesis that some proteins involved in a given physiological process may exist as two separate genes in one organism and as a single gene in another. Genomes are scanned for sequences that are independent in one organism and in a single open reading frame in another. If two genes have fused, it is predicted that they have similar biological functions that make such co-regulation advantageous.

Because of the large quantity of data produced by these techniques and the desire to find biologically meaningful patterns, bioinformatics is crucial to analysis of functional genomics data. Examples of techniques in this class are data clustering or principal component analysis for unsupervised machine learning (class detection) as well as artificial neural networks or support vector machines for supervised machine learning (class prediction, classification). Functional enrichment analysis is used to determine the extent of over- or under-expression (positive- or negative- regulators in case of RNAi screens) of functional categories relative to a background sets. Gene ontology based enrichment analysis are provided by DAVID and gene set enrichment analysis (GSEA), [16] pathway based analysis by Ingenuity [17] and Pathway studio [18] and protein complex based analysis by COMPLEAT. [19]

New computational methods have been developed for understanding the results of a deep mutational scanning experiment. 'phydms' compares the result of a deep mutational scanning experiment to a phylogenetic tree. [20] This allows the user to infer if the selection process in nature applies similar constraints on a protein as the results of the deep mutational scan indicate. This may allow an experimenter to choose between different experimental conditions based on how well they reflect nature. Deep mutational scanning has also been used to infer protein-protein interactions. [21] The authors used a thermodynamic model to predict the effects of mutations in different parts of a dimer. Deep mutational structure can also be used to infer protein structure. Strong positive epistasis between two mutations in a deep mutational scan can be indicative of two parts of the protein that are close to each other in 3-D space. This information can then be used to infer protein structure. A proof of principle of this approach was shown by two groups using the protein GB1. [22] [23]

Results from MPRA experiments have required machine learning approaches to interpret the data. A gapped k-mer SVM model has been used to infer the kmers that are enriched within cis-regulatory sequences with high activity compared to sequences with lower activity. [24] These models provide high predictive power. Deep learning and random forest approaches have also been used to interpret the results of these high-dimensional experiments. [25] These models are beginning to help develop a better understanding of non-coding DNA function towards gene-regulation.

The ENCODE project Edit

The ENCODE (Encyclopedia of DNA elements) project is an in-depth analysis of the human genome whose goal is to identify all the functional elements of genomic DNA, in both coding and noncoding regions. Important results include evidence from genomic tiling arrays that most nucleotides are transcribed as coding transcripts, noncoding RNAs, or random transcripts, the discovery of additional transcriptional regulatory sites, further elucidation of chromatin-modifying mechanisms.

The Genotype-Tissue Expression (GTEx) project Edit

The GTEx project is a human genetics project aimed at understanding the role of genetic variation in shaping variation in the transcriptome across tissues. The project has collected a variety of tissue samples (> 50 different tissues) from more than 700 post-mortem donors. This has resulted in the collection of >11,000 samples. GTEx has helped understand the tissue-sharing and tissue-specificity of EQTLs. [26]


Funding Opportunities

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.


비디오 보기: 2 CRISPR 활용 유전체 교정 기술 생명연 이승환 박사 (십월 2022).