เครื่องมือปัญญาประดิษฐ์ทำนายบทบาทการกำกับดูแลและโครงสร้าง 3 มิติของ DNA

9 สิงหาคม 2565

(ข่าวนาโนเวิร์ค:โปรแกรมปัญญาประดิษฐ์ (AI) ที่พัฒนาขึ้นใหม่ได้ทำนายบทบาทขององค์ประกอบการกำกับดูแลของ DNA และโครงสร้างสามมิติ (3D) ได้อย่างแม่นยำโดยอิงจากลำดับดิบของมันเท่านั้น ตามการศึกษาล่าสุดสองชิ้น พันธุศาสตร์ธรรมชาติ (“แผนที่ทั่วโลกตามลำดับของการถอดรหัสกิจกรรมการกำกับดูแลในพันธุศาสตร์ของมนุษย์”)

เครื่องมือเหล่านี้สามารถทำให้เกิดความกระจ่างใหม่ว่าการกลายพันธุ์ทางพันธุกรรมนำไปสู่โรคได้อย่างไรและอาจนำไปสู่ความเข้าใจใหม่ว่าลำดับพันธุกรรมส่งผลต่อการจัดโครงสร้างเชิงพื้นที่และการทำงานของ DNA โครโมโซมในนิวเคลียสอย่างไร Zhong, Ph.D., ผู้ช่วยศาสตราจารย์. ใน Lida Hill Department of Bioinformatics ที่ UTSW

ดร. จู สมาชิกของ Harold Simmons Comprehensive Program กล่าวว่า “ทั้ง 2 โครงการนี้ให้ภาพที่สมบูรณ์ยิ่งขึ้นว่าการเปลี่ยนแปลงในลำดับดีเอ็นเอ แม้แต่ในบริเวณที่ไม่มีการเข้ารหัส สามารถส่งผลกระทบอย่างมากต่อการจัดระเบียบเชิงพื้นที่และการทำงานอย่างไร” . : ศูนย์มะเร็ง นักวิชาการด้านการวิจัยทางการแพทย์ของมูลนิธิ Lupe Murchison และสถาบันป้องกันและวิจัยโรคมะเร็งแห่งเท็กซัส (CPRIT) โครงสร้าง 3 มิติที่คาดการณ์ไว้สำหรับส่วนของ DNA จีโนมของมนุษย์ โครงสร้าง 3 มิติที่คาดการณ์ไว้สำหรับส่วนของจีโนม DNA ของมนุษย์ (ภาพ: UT Southwestern Medical Center)

DNA ของมนุษย์ประมาณ 1% เท่านั้นที่เข้ารหัสคำแนะนำในการสร้างโปรตีน การวิจัยในช่วงไม่กี่ทศวรรษที่ผ่านมาแสดงให้เห็นว่าสารพันธุกรรมที่ไม่ได้เข้ารหัสที่เหลืออยู่ส่วนใหญ่มีองค์ประกอบด้านกฎระเบียบ เช่น โปรโมเตอร์ สารเพิ่มคุณภาพ ตัวเก็บเสียง และฉนวน ที่ควบคุมวิธีการแสดงรหัส DNA วิธีการที่ลำดับการควบคุมการทำงานขององค์ประกอบการกำกับดูแลเหล่านี้ส่วนใหญ่ยังไม่เป็นที่เข้าใจ ดร. Zhu อธิบาย

เพื่อให้เข้าใจถึงองค์ประกอบด้านกฎระเบียบเหล่านี้ได้ดียิ่งขึ้น เขาและเพื่อนร่วมงานที่มหาวิทยาลัยพรินซ์ตันและสถาบัน Flatiron ได้พัฒนารูปแบบการเรียนรู้เชิงลึกที่เรียกว่า Sei ซึ่งจำแนก DNA ที่ไม่ได้เข้ารหัสออกเป็น 40 “คลาสลำดับ” หรือฟังก์ชันต่างๆ เช่น ตัวเพิ่มประสิทธิภาพได้อย่างแม่นยำ กิจกรรมของยีนในเซลล์ต้นกำเนิดหรือเซลล์สมอง คลาสลำดับ 40 คลาสเหล่านี้ พัฒนาขึ้นจากชุดข้อมูลประมาณ 22,000 ชุดจากการศึกษาก่อนหน้าที่ตรวจสอบการควบคุมจีโนม ครอบคลุมมากกว่า 97% ของจีโนมมนุษย์ นอกจากนี้ Sei สามารถประเมินลำดับใดๆ โดยกิจกรรมที่คาดการณ์ไว้ในแต่ละคลาสของลำดับ 40 ลำดับ และคาดการณ์ว่าการกลายพันธุ์ส่งผลต่อกิจกรรมดังกล่าวอย่างไร

ด้วยการใช้ Sei กับข้อมูลทางพันธุกรรมของมนุษย์ นักวิจัยสามารถกำหนดลักษณะสถาปัตยกรรมการกำกับดูแลของ 47 ลักษณะและโรคที่บันทึกไว้ในฐานข้อมูล UK Biobank และอธิบายว่าการกลายพันธุ์ในองค์ประกอบด้านกฎระเบียบทำให้เกิดโรคเฉพาะได้อย่างไร ความสามารถดังกล่าวสามารถช่วยให้เข้าใจอย่างเป็นระบบมากขึ้นว่าการเปลี่ยนแปลงลำดับจีโนมสัมพันธ์กับโรคและลักษณะอื่นๆ อย่างไร ผลการวิจัยได้รับการเผยแพร่ในเดือนนี้

ในเดือนพฤษภาคม Dr. Zhu ได้รายงานการพัฒนาเครื่องมืออื่นที่เรียกว่า Orca ซึ่งทำนายสถาปัตยกรรม 3 มิติของ DNA ในโครโมโซมตามลำดับของมันพันธุศาสตร์ธรรมชาติ, “การสร้างแบบจำลองตามลำดับของสถาปัตยกรรมจีโนมสามมิติจากกิโลเบสถึงมาตราส่วนโครโมโซม”) การใช้ชุดข้อมูลที่มีอยู่ของลำดับดีเอ็นเอและข้อมูลโครงสร้างจากการศึกษาก่อนหน้านี้ที่เผยให้เห็นการพับ การบิด และการหมุนของโมเลกุล ดร. Zhu ได้ฝึกฝนแบบจำลองเพื่อสร้างการเชื่อมต่อและประเมินความสามารถของแบบจำลองในการทำนายโครงสร้างของมาตราส่วนความยาวต่างๆ

การวิจัยแสดงให้เห็นว่า Orca ทำนายโครงสร้าง DNA ขนาดเล็กและขนาดใหญ่โดยพิจารณาจากลำดับของพวกมันด้วยความแม่นยำสูง ซึ่งรวมถึงลำดับที่มีการกลายพันธุ์ที่เกี่ยวข้องกับสภาวะสุขภาพต่างๆ รวมถึงรูปแบบของมะเร็งเม็ดเลือดขาวและความผิดปกติของแขนขา Orca ยังช่วยให้นักวิจัยสร้างสมมติฐานใหม่เกี่ยวกับวิธีที่ลำดับดีเอ็นเอควบคุมโครงสร้าง 3D ในพื้นที่และขนาดใหญ่

ดร. โจวกล่าวว่าเขาและเพื่อนร่วมงานวางแผนที่จะใช้ Sei และ Orca ทั้งที่เปิดเผยต่อสาธารณะบนเว็บเซิร์ฟเวอร์และเป็นโอเพ่นซอร์ส เพื่อศึกษาเพิ่มเติมเกี่ยวกับบทบาทของการกลายพันธุ์ทางพันธุกรรมในอาการระดับโมเลกุลและทางกายภาพของโรค ซึ่งอาจนำไปสู่แนวทางใหม่ในการรักษาสภาพเหล่านี้ได้ในที่สุด