Запитання з тегом «r»

R - це вільна мова програмування з відкритим кодом та програмне середовище для статистичних обчислень, біоінформатики та графіки.

2
Тестування програмного забезпечення для наукових даних в R
Я часто використовую Nose, Tox або Unittest під час тестування коду python, особливо коли він повинен бути інтегрований з іншими модулями або іншими фрагментами коду. Однак тепер, коли я виявив, що використовую R більше, ніж пітон для моделювання та розвитку ML. Я зрозумів, що не дуже перевіряю свій R-код (І …

1
Конвергенція методу k-означає Hartigan-Wong та інших алгоритмів
Я намагаюся зрозуміти різні алгоритми кластеризації k-засобів, які в основному реалізовані в мовному statsпакеті R. Я розумію алгоритм Ллойда та онлайн-алгоритм MacQueen. Я розумію їх так: Алгоритм Ллойда: Спочатку вибираються випадкові спостереження 'k', які будуть служити центроїдами кластерів 'k'. Потім наступні кроки відбуваються в ітерації до сходження центроїдів. Розраховується евклідова …
10 r  clustering  k-means 

5
LSTM або інший пакет RNN для R
Я побачив вражаючий результат від моделей LSTM, що створюють тексти, подібні Шекспіру. Мені було цікаво, чи існує пакет LSTM для R. Я за ним гуглив, але знаходив лише пакети для Python та Julia. (можливо, є якась проблема продуктивності, яка пояснює, чому ці програми є більш переважними перед R). Чи знаєте …
10 r  neural-network  rnn 

1
Бібліотеки для (алгоритми розповсюдження міток / часте видобування підграфів) для графіків на R
Загальний опис проблеми У мене є графік, де деякі вершини позначені типом з 3 або 4 можливими значеннями. Для інших вершин тип невідомий. Моя мета - використовувати графік, щоб передбачити тип вершин, що не мають маркування. Можливі рамки Я підозрюю, що це вписується в загальні рамки проблем із розповсюдженням етикетки, …

4
Вивчення порядкової регресії в R?
Я працюю над проектом і мені потрібні ресурси, щоб довести мене до швидкості. Набір даних становить близько 35000 спостережень за 30 або близько змінними. Близько половини змінних є категоричними, при цьому деякі мають багато різних можливих значень, тобто якщо ви розділите категоричні змінні на фіктивні змінні, у вас було б …

3
Що таке обмеження пам'яті R?
Рецензуючи " Прикладне прогнозне моделювання ", рецензент зазначає : Однією з моїх критик педагогіки статистичного навчання є відсутність міркувань щодо обчислювальної роботи в оцінці різних методик моделювання. З його акцентом на завантажувальній та перехресній валідації для налаштування / тестування моделей, SL є досить обчислювальним. Додайте до цього повторний відбір зразків, …
10 apache-hadoop  r 

1
Чи потрібно нормалізувати дані, будуючи дерева рішень за допомогою R?
Отже, наш набір даних цього тижня має 14 атрибутів, і кожен стовпець має дуже різні значення. Один стовпець має значення нижче 1, а інший - у трьох-чотирьох цілих цифр. Ми дізналися про нормалізацію минулого тижня, і, здається, ви повинні нормалізувати дані, коли вони мають дуже різні значення. Чи стосується дерев …
10 r  beginner 

3
R випадковий ліс на Amazon ec2 Помилка: не можна виділити вектор розміром 5,4 Gb
Я randomForest()треную випадкові лісові моделі в R, використовуючи 1000 дерев і кадри даних з приблизно 20 прогнокторами і 600K рядками. На моєму ноутбуці все працює добре, але коли я переходжу на Amazon ec2, щоб запустити те саме, я отримую помилку: Error: cannot allocate vector of size 5.4 Gb Execution halted …

3
Чи існують методи машинного навчання для визначення точок на ділянках / зображеннях?
У мене є дані про бічне положення кожного автомобіля за часом та номер смуги руху, як показано на цих 3-х графіках на зображенні та зразках даних нижче. > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 456 …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.