Я працюю з великим набором даних акселерометра, зібраними за допомогою декількох датчиків, які носили багато предметів. На жаль, тут, здається, ніхто не знає технічних характеристик пристроїв, і я не думаю, що вони ніколи не були повторно відкалібровані. У мене не багато інформації про пристрої. Я працюю над магістерською дисертацією, акселерометри були запозичені в іншому університеті і взагалі ситуація була трохи непрозорою. Отже, попередня обробка пристрою на борту? Ніякої підказки.
Що я знаю, це те, що це трихосні акселерометри з частотою дискретизації 20 Гц; цифрові та імовірно MEMS. Мене цікавить невербальна поведінка та жестикуляція, які, за моїми джерелами, в основному повинні виробляти активність в діапазоні 0,3-3,5 Гц.
Нормалізація даних видається цілком необхідною, але я не впевнений, що використовувати. Дуже велика частина даних близька до значень решти (вихідні значення ~ 1000, від тяжкості), але є деякі крайнощі, наприклад, до 8000 в одних журналах, або навіть 29000 в інших. Дивіться зображення нижче . Я думаю, що це робить поганою ідеєю розділити на max або stdev для нормалізації.
Який звичайний підхід у такому випадку? Розділити на медіану? Значення відсотків? Щось ще?
Як побічна проблема, я також не впевнений, чи слід вирізати крайні значення.
Дякую за будь-яку пораду!
Редагувати : Ось сюжет про приблизно 16 хвилин даних (20000 зразків), щоб дати уявлення про те, як типово розподіляються дані.