Новини, як правило, використовують "Великі дані" досить невміло. Зазвичай продавці надають приклади, що стосуються конкретних товарів. Існує не багато для реалізації з відкритим кодом, але вони згадаються. Наприклад, Apache не збирається витрачати багато часу, будуючи тематичне дослідження про hadoop, але такі постачальники, як Cloudera та Hortonworks, ймовірно, будуть.
Ось приклад прикладу Cloudera у фінансовому секторі.
Цитуючи дослідження:
Один з основних світових конгломератів фінансових послуг використовує Cloudera та Datameer, щоб допомогти виявити недобросовісну торговельну діяльність. Команди в групі управління активами фірми здійснюють спеціальний аналіз щоденних даних про ціну, позицію та замовлення. Надання спеціального аналізу всіх детальних даних дозволяє групі виявити аномалії в певних класах активів та виявити підозрілу поведінку. Користувачі раніше покладалися виключно на інструменти електронних таблиць. Тепер, завдяки Datameer та Cloudera, користувачі мають потужну платформу, яка дозволяє їм швидше просіювати більше даних та запобігати потенційним втратам до їх початку.
.
Провідний роздрібний банк використовує Cloudera та Datameer для перевірки точності та якості даних, що вимагається Законом Додда-Франка та іншими правилами. Інтегруючи дані про позики та філії, а також дані щодо управління багатством, ініціатива банку щодо якості даних несе відповідальність за забезпечення точності кожного запису. Процес включає піддавання даних більш ніж 50 перевірок надійності та якості даних. Результати цих перевірок з часом відстежуються, щоб гарантувати, що допуски до корупції даних та доменів даних не змінюються негативно і що профілі ризику, які повідомляються інвесторам та регуляторним агенціям, є розсудливими та відповідають нормативним вимогам. Про результати повідомляється через інформаційну панель якості даних головного директора з питань ризику та головного фінансового директора,
Я не бачив жодних інших досліджень, пов'язаних з фінансами, у Cloudera, але не дуже важко шукав. Ви можете подивитися їхню бібліотеку тут.
Крім того, у Hortonworks є тематичне дослідження торгових стратегій, де вони побачили на 20% зменшення часу, необхідного для розробки стратегії, використовуючи K-засоби, Hadoop та R.
Вони не відповідають на всі ваші запитання. Я впевнений, що обидва ці дослідження охоплювали більшість із них. Я не бачу нічого конкретно щодо вибору інструменту. Я думаю, що представники продажів мали багато спільного з отриманням загального продукту у дверях, але самі вчені використовували інструменти, якими вони були найзручнішими. У мене немає великого розуміння цієї області у просторі даних.