Machine learning identifiziert herkömmliche DNS-Strukturen

Forscher von HSE-Universität verwendet haben, maschinelles lernen, zu entdecken, dass die zwei am meisten verbreiteten DNA-Strukturen—stem-loops und quadruplexen—Ursache Genom-Mutationen, die zu Krebs führen. Die Ergebnisse der Studie wurden veröffentlicht in BMC Krebs.

In den frühen 2000er Jahren Forscher erfand eine neue Methode, um die Nukleotid-Sequenz der DNA und RNA, genannt Next-Generation-Sequencing (NGS). Diese Technologie ermöglicht das gleichzeitige Lesen von mehreren Millionen Genom-Regionen, die unmöglich war mit früheren Methoden Sequenzierung. Nun, das menschliche Genom aufgenommen werden können in die eine 3,2 Gb-text-Datei.

„Krebs ist eine Genom-Krankheit“, erklärt Maria Poptsova, Leiter der HSE-Labor für Bioinformatik und einer von den Autoren der Studie. „Wenn wir die Sequenz das Genom in ein Tumorgewebe, sehen wir ein Spektrum von verschiedenen Mutationen. Kann es sein, Punkt oder groß-Mutationen. Zum Beispiel, im Punkt-Mutationen, ein Nukleotid verschwindet und durch ein anderes ersetzt wird. Wir sahen uns an large-scale-Mutationen, wo Teile des Genoms (von zig Millionen Nukleotide) wurden gelöscht, vertauscht, kopiert, eingefügt und an einem anderen Ort. Als Folge dieser Umstellungen Genom-Haltepunkte angezeigt.

Mithilfe von machine-learning -, HSE-University-Forscher untersucht den Einfluss der beiden Arten von DNA-sekundärstrukturen—stem-loops und quadruplexen—auf Genom-Haltepunkte. Die Autoren analysierten eine halbe million Haltepunkte in über 2000 Genome von 10 Arten von Krebs. Die Forscher untersuchten für die genomische hotspots, wenn man bedenkt Haltepunkt hotspots werden Regionen mit häufigen und wiederkehrenden Umstellungen—in anderen Worten -, Risiko-Zonen. Es zeigte sich, dass der stem-loop-basiertes Modell am besten erklärt, Blut, Gehirn, Leber und Prostata-Krebs Haltepunkt hotspot-profile, während ein quadruplex-basiertes Modell hat eine höhere Leistung für Knochen -, Brust -, Eierstock -, Pankreas-und Hautkrebs.

Das Erscheinungsbild der Haltepunkte erklärt sich nicht ausschließlich durch den Einfluss von DNA-sekundärstrukturen, aber Ihr Beitrag ist mindestens 20 bis 30 Prozent. Die Analyse zeigt, dass der Einfluss des stem-loops und quadruplexen auf Haltepunkt evolution hängt von der Art des Gewebes, die durch epigenetische Faktoren festgelegt.

„Dies sind die Art von Markierern, die Unterscheidung verschiedener Arten von Geweben, die über das Genom,“ sagte Maria Poptsova. „Wir sind aktiv auf der Untersuchung der Zusammenhänge zwischen sekundären DNA-Strukturen und epigenetischen Markierungen. Britische Forscher haben bereits betrachtete die Auswirkungen von DNA-sekundärstrukturen und epigenetische Markierungen, die auf Punktmutationen. Wir konzentrierten uns auf breakpoint-hotspots und sind die ersten, um zu bestimmen, den Beitrag der beiden am meisten verbreiteten Genom-Strukturen—stem-loops und quadruplexen.“