Запитання з тегом «bioinformatics»

Дисципліна на перехресті обчислювальної та біологічної наук, яка передбачає організацію, ведення та аналіз даних з таких галузей, як молекулярна біологія, генетика та геноміка

11
Ресурси для вивчення ланцюга Маркова та прихованих моделей Маркова
Я шукаю ресурси (навчальні посібники, підручники, веб-трансляція тощо), щоб дізнатися про Марківську ланцюжок та НММ. Моя професія - це біолог, і я зараз беру участь у проекті, пов'язаному з біоінформатикою. Крім того, які необхідні математичні основи мені потрібні, щоб мати достатнє розуміння моделей Маркова та НММ? Я роздивлявся, використовуючи Google, …

3
Інтерпретація прогнозованого прогнозу та / або відповіді перетвореного журналом
Мені цікаво, чи має значення інтерпретація, чи трансформуються лише залежні, і залежні, і незалежні, або лише незалежні змінні. Розглянемо випадок log(DV) = Intercept + B1*IV + Error Я можу трактувати ІV як збільшення відсотка, але як це змінюється, коли я маю log(DV) = Intercept + B1*log(IV) + Error або коли …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
Безперервне узагальнення негативного біноміального розподілу
Негативний двочленний (NB) розподіл визначається на невід'ємні цілі числа і має функцію масової ймовірностіЧи має сенс розглянути безперервний розподіл на негативних реалах, визначених тією ж формулою (замінивши на x \ in \ mathbb R _ {\ ge 0} )? Біноміальний коефіцієнт можна переписати як добуток (k + 1) \ cdot …

4
Що ми можемо дізнатися про людський мозок із штучних нейронних мереж?
Я знаю, що моє запитання / назва не дуже конкретне, тому я спробую його прояснити: Штучні нейронні мережі мають відносно суворі конструкції. Звичайно, загалом на них впливає біологія і намагаються побудувати математичну модель реальних нейронних мереж, але наше розуміння реальних нейронних мереж недостатнє для побудови точних моделей. Тому ми не …

3
Чи можна алгоритм MIC для виявлення нелінійних кореляцій пояснити інтуїтивно?
Зовсім недавно я прочитав дві статті. Перший - про історію кореляції, а другий - про новий метод під назвою Максимальний інформаційний коефіцієнт (MIC). Мені потрібна ваша допомога щодо розуміння методу MIC для оцінки нелінійних кореляцій між змінними. Більше того, Інструкції щодо використання в R можна знайти на веб-сайті автора (у …

2
тренінгові підходи для сильно незбалансованого набору даних
У мене сильно незбалансований набір даних тесту. Позитивний набір складається з 100 випадків, тоді як негативний - 1500 випадків. Що стосується тренінгу, у мене є більший пул кандидатів: позитивний навчальний набір має 1200 випадків, а негативний навчальний набір - 12000 випадків. Для подібного сценарію у мене є кілька варіантів: 1) …

4
Обрамлення негативного біноміального розподілу для послідовності ДНК
Негативний біноміальний розподіл став популярною моделлю для підрахунку даних (зокрема, очікуваної кількості зчитування послідовностей у певній області геному від заданого експерименту) у біоінформатиці. Пояснення варіюються: Деякі пояснюють це як щось, що працює як розподіл Пуассона, але має додатковий параметр, що дозволяє більше свободи моделювати справжній розподіл, причому дисперсія не обов'язково …

8
Які "гарячі алгоритми" для машинного навчання?
Це наївне питання того, хто починає вивчати машинне навчання. Я читаю в наші дні книгу "Машинне навчання: алгоритмічна перспектива" від Marsland. Я вважаю це корисним як вступна книга, але зараз я хотів би перейти до вдосконалених алгоритмів, тих, які в даний час дають найкращі результати. Мене найбільше цікавить біоінформатика: кластеризація …

7
Здійснення сенсу із теорії та застосувань статистики
Нещодавно я закінчила ступінь магістра з медичного та біологічного моделювання, супроводжуючи інженерну математику як основу. Навіть незважаючи на те, що моя навчальна програма включала значну кількість курсів з математичної статистики (див. Список нижче), які я вів із досить високими оцінками, я часто закінчуюсь повністю втраченою, дивлячись як на теорію, так …

2
Обчислення ймовірності перекриття списку генів між послідовністю РНК та набором даних ChIP-чіпа
Сподіваюся, хтось на цих форумах може допомогти мені вирішити цю основну проблему в дослідженнях експресії генів. Я зробив глибоке секвенування експериментальної та контрольної тканини. Потім я отримав значення кратного збагачення генів в експериментальному зразку над контролем. Референтний геном має ~ 15 000 генів. 3 000 з 15 000 генів збагатилися …

2
Аналіз збагачення за рівнем дублювання генів
Біологічне підґрунтя З часом деякі види рослин прагнуть дублювати цілі геноми, отримуючи додаткову копію кожного гена. Через нестабільність цієї установки багато з цих генів потім видаляються, а геном переставляє себе і стабілізується, готовий повторно повторюватися. Ці події дублювання пов'язані з подіями видозміни та інвазії, і теорія полягає в тому, що …

3
Чому в дослідженні генетичної асоціації можна було б використовувати віковий квадрат як коваріат?
Чому в дослідженні генетичної асоціації можна використовувати вік і квадратик як коваріати? Я можу зрозуміти використання віку, якщо він був визначений як значний коваріат, але я втрачаю з точки зору використання вікового квадрата.

1
Чому Anova () та drop1 () надали різні відповіді для GLMM?
У мене є GLMM форми: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Під час використання drop1(model, test="Chi")я отримую інші результати, ніж якщо я використовую Anova(model, type="III")з автомобільного пакета або summary(model). Ці два останні дають однакові відповіді. Використовуючи купу сфабрикованих даних, я виявив, що …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
Яка різниця між статистикою та інформатикою?
Ми завжди кажемо, що статистика просто стосується даних. Але ми також знаємо, що інформатика також отримує знання з аналізу даних. Наприклад, люди з біоінформатики можуть повністю пройти без біостатистики. Хочу знати, в чому суттєва різниця між статистикою та інформатикою.

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.