Big Data (Wielkie Zbiory Danych) to termin określający ogromne, złożone zbiory informacji (ustrukturyzowanych i luźnych), których objętość i tempo przyrostu wymuszają zastosowanie specjalistycznych narzędzi analitycznych, w tym algorytmów uczenia maszynowego (Machine Learning).
Co to znaczy
Obecny przełom w narzędziach AI byłby niemożliwy bez dostępu do odpowiednio masywnych zbiorów danych. Tradycyjna analityka rynkowa często operowała na zagregowanych wynikach (np. średnie miesięczne). Big Data uwzględnia miliony punktów styku (tzw. touchpoints): historię ruchów w aplikacji, czas zatrzymania ekranu na elemencie czy surowe wzmianki tekstowe. Analiza tak złożonych wolumenów przy pomocy sztucznej inteligencji pozwala identyfikować nieoczywiste wcześniej mikro-korelacje między zachowaniami konsumentów.
Dlaczego to ważne
Przejście od segmentacji szerokich grup demograficznych do analityki mikro-wzorców zachowań. Pozwala to na wysoki poziom personalizacji usług i lepsze dostosowanie komunikatów w kanałach dystrybucji na podstawie historycznych śladów pozostawianych przez klientów.
W systemie poleceń dużej platformy VOD analizowane są nie tylko same tytuły wyświetlane przez tysiące użytkowników. Modele głębokiego uczenia przetwarzają surowe dane (Big Data) takie jak pora pauzowania odcinka i rodzaj przewijanego gatunku, generując niezwykle precyzyjne dopasowania rekomendacji dla profilu konkretnego odbiorcy.
Czym to nie jest
- Analiza baz opartych na prostych, małych arkuszach kalkulacyjnych. Big Data charakteryzuje się tzw. Zasadą 3V: ogromną objętością (Volume), różnorodnością formatów (Variety) i szybkością przyrostu (Velocity).
- Zamiennik dla ustrukturyzowanych relacyjnych baz danych (SQL) przy mniejszych środowiskach analitycznych.
Jak rozpoznać
Słyszysz często pojęcia takie jak „Hurtownie Danych (Data Warehouses)”, „Data Lakes” oraz technologie przetwarzania klastrowego.