Scientific Library of Tomsk State University

   E-catalog        

Image from Google Jackets
Normal view MARC view

Главные компоненты генетических последовательностей: корреляции и достоверность В. М. Ефимов, К. В. Ефимов, В. Ю. Ковалева, Ю. Г. Матушкин

Contributor(s): Ефимов, Вадим Михайлович | Ефимов, Кирилл Вадимович | Ковалева, Вера Юрьевна | Матушкин, Юрий ГеоргиевичMaterial type: ArticleArticleContent type: Текст Media type: электронный Other title: Principal components of genetic sequences: correlations and significance [Parallel title]Subject(s): метод SSA | метод главных компонент | исследование генов | кодирующая последовательность гена | вторичная структура белка | внешние факторы | бутстреп-методGenre/Form: статьи в журналах Online resources: Click here to access online In: Математическая биология и биоинформатика Т. 16, № 2. С. 299-316Abstract: Известно, что любой числовой ряд можно разложить на главные компоненты с помощью сингулярного спектрального анализа. Недавно мы предложили новый метод анализа PCA-Seq, который позволяет вычислять числовые главные компоненты для последовательности элементов любой природы. В частности, последовательность может быть символьной, в том числе, нуклеотидной или аминокислотной. При этом неизбежно встают два вопроса: об интерпретации полученных главных компонент и об оценке их достоверности. Для интерпретации главных компонент разумно вычислять их корреляции с любыми числовыми характеристиками элементов изучаемой последовательности, используемыми в данной предметной области ‒ внешними факторами. При оценке достоверности корреляций между последовательностями необходимо учитывать, что стандартные критерии значимости опираются на предположение независимости наблюдений, которое для реальных последовательностей, как правило, не выполняется. В статье рассматривается применение для этих целей якорного бутстрепа, также ранее разработанного авторами статьи. В этом методе предполагается, что объекты могут быть представлены точками метрического пространства и в совокупности составляют в нем некоторую фиксированную структуру, в частности, последовательность. Объектам приписываются те же случайные целочисленные веса, что и при классическом бутстрепе. Этого достаточно для получения бутстреп-распределения коэффициентов корреляции и оценки их достоверности. При исследовании гена SLC9A1 (синонимы APNH, NHE1, PPP1R143) выявились достоверные корреляции первой главной компоненты кодирующей последовательности с гидрофобностью / “трансмембранностью” соответствующих фрагментов аминокислотной последовательности, содержанием в них фенилаланина, а также разностью содержания тимина и аденина в нуклеотидных фрагментах. Похожая закономерность была найдена другими авторами для других генов, весьма вероятно, что она имеет более общий характер
Tags from this library: No tags from this library for this title. Log in to add tags.
No physical items for this record

Библиогр.: 41 назв.

Известно, что любой числовой ряд можно разложить на главные компоненты с помощью сингулярного спектрального анализа. Недавно мы предложили новый метод анализа PCA-Seq, который позволяет вычислять числовые главные компоненты для последовательности элементов любой природы. В частности, последовательность может быть символьной, в том числе, нуклеотидной или аминокислотной. При этом неизбежно встают два вопроса: об интерпретации полученных главных компонент и об оценке их достоверности. Для интерпретации главных компонент разумно вычислять их корреляции с любыми числовыми характеристиками элементов изучаемой последовательности, используемыми в данной предметной области ‒ внешними факторами. При оценке достоверности корреляций между последовательностями необходимо учитывать, что стандартные критерии значимости опираются на предположение независимости наблюдений, которое для реальных последовательностей, как правило, не выполняется. В статье рассматривается применение для этих целей якорного бутстрепа, также ранее разработанного авторами статьи. В этом методе предполагается, что объекты могут быть представлены точками метрического пространства и в совокупности составляют в нем некоторую фиксированную структуру, в частности, последовательность. Объектам приписываются те же случайные целочисленные веса, что и при классическом бутстрепе. Этого достаточно для получения бутстреп-распределения коэффициентов корреляции и оценки их достоверности. При исследовании гена SLC9A1 (синонимы APNH, NHE1, PPP1R143) выявились достоверные корреляции первой главной компоненты кодирующей последовательности с гидрофобностью / “трансмембранностью” соответствующих фрагментов аминокислотной последовательности, содержанием в них фенилаланина, а также разностью содержания тимина и аденина в нуклеотидных фрагментах. Похожая закономерность была найдена другими авторами для других генов, весьма вероятно, что она имеет более общий характер

There are no comments on this title.

to post a comment.