Обмін даними класифікується як описовий або прогнозований. Описовий пошук даних - це пошук масивних наборів даних та виявлення розташування несподіваних структур або взаємозв'язків, закономірностей, тенденцій, кластерів та переживань даних. З іншого боку, прогнозування полягає у створенні моделей і процедур для регресії, класифікації, розпізнавання шаблонів або завдань машинного навчання та оцінки точності прогнозування цих моделей та процедур при застосуванні до нових даних.
Механізм, який використовується для пошуку шаблонів або структури у високомірних даних, може бути ручним або автоматизованим; для пошуку може знадобитися інтерактивний запит на систему управління базами даних, або це може спричинити використання програм візуалізації для виявлення аномалій у даних. У термінах машинного навчання описовий обмін даними називається непідвладним навчанням, тоді як прогнозний обмін даними називається наглядовим навчанням.
Більшість методів, що застосовуються при обробці даних, пов'язані з методами, розробленими в статистиці та машинному навчанні. Найважливішим з цих методів є загальні теми регресії, класифікації, кластеризації та візуалізації. Через величезні розміри наборів даних багато застосувань видобутку даних зосереджуються на методах зменшення розмірності (наприклад, змінному підборі) та ситуаціях, коли підозрювані у високовимірних даних лежать на низькомірних гіперпланах. Нещодавно увага була спрямована на методи ідентифікації об'ємних даних, що лежать на нелінійних поверхнях чи колекторах.
Існують також ситуації при обробці даних, коли статистичний висновок - у його класичному розумінні - або не має ніякого значення, або має сумнівну силу: перший виникає, коли ми маємо всю сукупність шукати відповіді, а останній виникає, коли набір даних є Вибірка «зручності», а не випадкова вибірка, взята з великої кількості населення. Коли дані збираються через час (наприклад, роздрібні операції, операції на фондовому ринку, записи пацієнтів, облік погоди), вибірка також не може мати сенсу; впорядкованість за часом спостережень має вирішальне значення для розуміння явища, що генерує дані, а розгляд спостережень як незалежних, коли вони можуть бути сильно корельованими, дасть необ’єктивні результати.
Основними компонентами обміну даними є - крім статистичної теорії та методів - обчислювальна та обчислювальна ефективність, автоматична обробка даних, динамічні та інтерактивні методи візуалізації даних та розробка алгоритмів.
Одне з найважливіших питань в обробці даних - обчислювальна проблема масштабованості . Алгоритми, розроблені для обчислення стандартних дослідницьких та підтверджуючих статистичних методів, були розроблені для того, щоб бути швидкими та обчислювально ефективними при застосуванні до малих та середніх наборів даних; все ж, було показано, що більшість із цих алгоритмів не вирішують складність обробки величезних наборів даних. У міру зростання наборів даних багато існуючих алгоритмів демонструють тенденцію до різкого сповільнення (або навіть приборкання до зупинки).