Запитання з тегом «genetics»

Наукове вивчення принципів спадковості та зміни спадкових ознак серед споріднених організмів.

6
Вибір особливостей для "остаточної" моделі при виконанні перехресної перевірки в машинному навчанні
Я трохи розгублений щодо вибору функцій та машинного навчання, і мені було цікаво, чи можете ви мені допомогти. У мене є набір даних мікромасив, який класифікується на дві групи та має 1000 функцій. Моя мета - отримати невелику кількість генів (мої особливості) (10-20) у підписі, які я теоретично зможу застосувати …

6
Яка ймовірність я походити від конкретної людини, народженої в 1300 році?
Іншими словами, виходячи з наступного, що таке p? Для того, щоб зробити це математичною проблемою, а не антропологією чи суспільствознавством, а також спростити проблему, припустимо, що товаришів обирають з однаковою ймовірністю для всієї сукупності, за винятком того, що брати і сестри та перші родички ніколи не спарюються, а товариші завжди …

4
Виправлення p-значень для декількох тестів, де тести співвідносяться (генетика)
Я маю значення p з багатьох тестів і хотів би знати, чи є насправді щось важливе після виправлення для багаторазового тестування. Ускладнення: мої тести не є незалежними. Метод, про який я думаю (варіант методу продукту Фішера, Зайкін та ін., Genet Epidemiol , 2002), потребує кореляції між значеннями p. Для того, …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
У дослідженнях асоціації, пов’язаних з геномом, які основні компоненти?
У дослідженнях асоціації, пов’язаних з геномом (GWAS): Які основні компоненти? Для чого вони використовуються? Як вони обчислюються? Чи можна проводити дослідження асоціації, пов’язане з геном, без використання PCA?
20 pca  genetics  gwas 

1
Як працює нормалізація квантилів?
У дослідженнях експресії генів за допомогою мікроматеріалів дані про інтенсивність мають бути нормалізовані, щоб можна було порівнювати інтенсивність між індивідами, між генами. Концептуально та алгоритмічно, як працює «нормалізація кванті», і як би ви пояснили це нестатисту?

2
Обчислення ймовірності перекриття списку генів між послідовністю РНК та набором даних ChIP-чіпа
Сподіваюся, хтось на цих форумах може допомогти мені вирішити цю основну проблему в дослідженнях експресії генів. Я зробив глибоке секвенування експериментальної та контрольної тканини. Потім я отримав значення кратного збагачення генів в експериментальному зразку над контролем. Референтний геном має ~ 15 000 генів. 3 000 з 15 000 генів збагатилися …

2
Аналіз збагачення за рівнем дублювання генів
Біологічне підґрунтя З часом деякі види рослин прагнуть дублювати цілі геноми, отримуючи додаткову копію кожного гена. Через нестабільність цієї установки багато з цих генів потім видаляються, а геном переставляє себе і стабілізується, готовий повторно повторюватися. Ці події дублювання пов'язані з подіями видозміни та інвазії, і теорія полягає в тому, що …

1
Аналіз потужності для аналізу виживання
Якщо я гіпотезую, що генний підпис визначатиме суб'єктів, що мають менший ризик рецидиву, тобто зменшення на 0,5 (коефіцієнт небезпеки 0,5), рівень подій у 20% населення, і я маю намір використати зразки ретроспективного когортного дослідження. розмір вибірки потрібно відкоригувати для неоднакових чисел у двох гіпотезованих групах? Наприклад, використовуючи Collett, D: Моделювання …

3
Чому в дослідженні генетичної асоціації можна було б використовувати віковий квадрат як коваріат?
Чому в дослідженні генетичної асоціації можна використовувати вік і квадратик як коваріати? Я можу зрозуміти використання віку, якщо він був визначений як значний коваріат, але я втрачаю з точки зору використання вікового квадрата.

2
М'яке порогове порівняно проти лассо пеналізації
Я намагаюсь узагальнити те, що я зрозумів до цього часу в пеналізованому багатоваріантному аналізі з великомірними наборами даних, і я все ще намагаюся отримати правильне визначення м'якої порогової оцінки проти Лассо (або ) пеналізації.L1L1L_1 Точніше, я використовував розріджену регресію PLS для аналізу 2-блокної структури даних, включаючи геномні дані ( одномолекулярні …

3
Відстань махаланобіса через PCA, коли
Я маю матрицю, де - кількість генів і - кількість пацієнтів. Той, хто працював з такими даними, знає, що завжди більше . Використовуючи вибір функцій, я отримав вниз до більш розумного числа, однак все ж більший за .n × pн×pn\times ppppннnpppннnppppppннn Я хотів би обчислити подібність пацієнтів на основі їх …

1
Як обчислити стандартну помилку коефіцієнтів шансів?
У мене є два набори даних із досліджень, пов'язаних з геномом. Єдина доступна інформація - коефіцієнт шансів і значення р для першого набору даних. Для другого набору даних я маю коефіцієнт коефіцієнта, p-значення та частоти алелей (AFD = хвороба, AFC = управління) (наприклад: 0,321). Я намагаюся зробити метааналіз цих даних, …

1
Як дітям вдається зібрати батьків у проекції PCA набору даних GWAS?
Візьміть 20 випадкових точок у 10-мірному просторі з кожною координатною лінією від N( 0 , 1 )N(0,1)\mathcal N(0,1). Розділіть їх на 10 пар ("пари") і додайте до набору даних середнє значення кожної пари ("дитина"). Потім зробіть PCA на отриманих 30 очках і побудуйте графік PC1 проти PC2. Відбувається чудова річ: …

4
Як обчислити довірчі інтервали для об'єднаних непарних коефіцієнтів у мета-аналізі?
У мене є два набори даних із досліджень, пов'язаних з геномом. Єдиною доступною інформацією є непарні коефіцієнти та їх довірчі інтервали (95%) для кожного генотипованого SNP. Я хочу створити лісову ділянку, порівнюючи ці два коефіцієнти шансів, але я не можу знайти спосіб обчислити комбіновані довірчі інтервали для візуалізації підсумкових ефектів. …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.