W dzisiejszych czasach jesteśmy niemal zalewani masą danych pochodzących z rozmaitych źródeł: od zwykłych informacji ze stron internetowych, przez media społecznościowe, aż do danych uzyskiwanych bezpośrednio od klientów. Te wszystkie elementy możemy zebrać razem i nazwać eksploracją.
Eksploracja czy zdobywanie?
Eksploracja danych to nic innego jak zdobywanie, pozyskiwanie lub wydobywanie wiedzy z różnych baz danych. Wykorzystuje się do tego komputera i efektywność eksploracji jest bezpośrednio zależna od jego szybkości. Zanim bowiem przejdziemy do pracy z danymi musimy uświadomić sobie jak wielkie są ich zasoby. Dla przykładu zwykłe supermarkety dziennie rejestrują sprzedaż ponad tysiąca produktów, banki księgują tysiące transakcji, a w archiwum Google mieszczą się miliardy stron. Człowiek nie byłby w stanie samodzielnie przetworzyć takiej ilości danych, stąd też na ratunek przybywają programy do eksploracji danych.
Eksploracja danych to proces, który musi spełniać dwa podstawowe warunki: być zautomatyzowany i nie wymagać nadzoru człowieka. Dzięki tym warunkom przebiega on szybko i okazuje się niezwykle korzystny dla przedsiębiorstw i instytucji.
Jakie są metody eksploracji danych?
Metody eksploracji danych dzielimy ze względu na ich cel oraz wzorce, jakie odkrywane są podczas tego procesu. Ogólnie można wyszczególnić sześć metod eksploracji:
– klasyfikacja- odkrywanie zależności między klasyfikacją danych i ich charakterystyką
– odkrywanie asocjacji- odnajdywanie ciekawych zależności między danymi w dużych bazach
– grupowanie- znalezienie skończonych zbiorów obiektów o podobnych cechach
– wykrywanie zmian i odchyleń- odnajdywanie różnic między aktualnymi a oczekiwanymi wartościami
– odkrywanie osobliwych punktów- wykrywanie obiektów niepasujących do schematu
– analiza przebiegów czasowych- odnajdywanie podobieństw w przebiegach czasowych
Gdzie stosujemy?
Eksploracja danych jest wykorzystywana w wielu obszarach: od szeroko pojętej nauki, przez reklamy, aż po biznes. Warto pamiętać, że do danych należą nie tylko artykuły, które kupujemy, ale także różne schematy zakupów, czy nawet profile klientów.