Analiza danych to dyscyplina, która w ostatnich latach zdobyła dużą popularność. Istnieją też powiązane terminy takie m.in. jak big data, data mining czy data science. Zobacz poradnik po analizie danych, który wyjaśnia najważniejsze pojęcia.
Big data
Dane i informacje są wszechobecne, a postępująca cyfryzacja naszego życia tylko zwiększa ich ilość. Już dziesięć lat temu głośno było o wielkich zasobach danych, których gromadzenie, przetwarzanie i wykorzystanie służy do uzyskiwania przewagi konkurencyjnej i kolejnych innowacji technologicznych.
Tradycyjnie wielkie zasoby danych (ang. big data) definiuje się jako zbiór danych, cechujący się bardzo dużą wielkością, różnorodnością i dużym wolumenem przetwarzania tzw. 3V (ang. volume, variety, velocity).
Obserwowany w 2023 roku boom na generatywną sztuczną inteligencję (ang. genAI – generative artificial intelligence) czerpie bezpośrednio z modnego do niedawna “big data”. Bo przecież zgromadzone wcześniej wielkie zasoby danych pozwoliły wytrenować modele. A te modele są podstawą nowego hype: napędzanych AI czatów czy generatorów obrazów i dźwięków.
Zresztą podejmowanie decyzji opartych na faktach (ang. fact-based decision making) jest nie tylko modne ale skuteczne. Wielkie koncerny inwestują miliony w nowoczesne algorytmy – a te algorytmy korzystają z danych żeby osiągać założone cele. Firmy IT promują swoje hurtownie danych (ang. data warehouse) i oprogramowanie analityki biznesowej (ang. business intelligence) bo decyzje oparte o dane daję przewagę, ograniczają ryzyko i pozwalają na rozwój szybszy niż konkurencja. Mniejsze firmy też masowo korzystają z danych bo narzędzia służące do ich obsługi są powszechnie dostępne i często są dostępne za darmo. Wszechobecny internet, technologie mobilne i chmurowe, zdalna rozrywka i media społecznościowe – wszystko jest napędzane danymi. Ktoś musi te dane “ogarnąć” – i tym kimś jest analityk danych.
Analityk danych i analiza danych
Analityk danych (ang. data analyst) to specjalista, który pozyskuje, przetwarza i analizuje dane z różnorodnych źródeł w celu wsparcia podejmowania decyzji służących osiąganiu założonych celów. Zwykle pracuje w strukturach organizacji ale bywa też zewnętrznym konsultantem albo autorem publikacji przeznaczonych dla organizacji i ich kierownictwa. Jego stanowiska może się różnie nazywać, może być mniej lub bardziej wyspecjalizowanym w jakimś kierunku, może też prowadzić analizę ręcznie, ze wsparciem różnych narzędzi lub wręcz automatycznie. Wszystko zależy od kontekstu ale dopóki sednem jest sprawne posługiwanie się danymi – najczęściej można to określić mianem analizy danych.
Analiza danych (ang. data analysis) przybiera różne formy. Z jednej strony może polegać na tworzeniu i publikowaniu raportów opartych o wewnętrzne dane organizacji. Z drugiej wprost przeciwnie: może polegać na badaniu otoczenia – szczególnie rynku, na którym działa firma. Może polegać na prowadzeniu badań marketingowych czy wywiadu konkurencyjnego (ang. competitive intelligence) albo budowaniu systemu raportowania i informowania decydentów na podstawie danych zgromadzonych w bazach danych organizacji. Może też wiązać się z tzw. białym wywiadem (ang. OSINT – open-source intelligence), który polega na kreatywnym pozyskiwaniu informacji z źródeł powszechnie dostępnych. Analiza może mieć na celu wspieranie podejmowania decyzji strategicznych czy też usprawnianiu bieżących operacji i podnoszeniu efektywności.
Stanowiska, które zajmują analitycy danych mogą się w związku z tym przeróżnie nazywać: analityk, analityk danych, analityk w dziale np.: sprzedaży, analityk do spraw np.: marketingu, inżynier danych, specjalista ds. raportowania, specjalista ds. sprawozdawczości, specjalista do spraw analiz – itd. itp. Często nazwy te są jeszcze określone nazwą jakiegoś oprogramowania służącego przetwarzaniu danych.
Ale analitycy danych to nie są wyłącznie określone osoby. Każdy z nas bywa w pewnym stopniu analitykiem danych. W wielu zawodach trzeba czasem zebrać i przeanalizować informacje, które pomagają potem zdecydować o dalszych działaniach. Dlatego warto uczyć się analizy danych nawet jeśli nie jest to nasza podstawowa rola. Umiejętność sprawnego znajdowania i korzystania z informacji zawsze będzie w cenie w naszym scyfryzowanym i połączonym globalną siecią świecie.
Nauka o danych
Analiza danych zrodziła w ostatnich latach nowe pojęcie: naukę o danych. Jest to określenie potoczne bo nie istnieje formalna dyscyplina naukowa o takiej nazwie. Nauka o danych jest jednak działalnością na styku nauki, inżynierii i programowania. Często korzysta z metody naukowej, a wielu jej praktyków posiada doktoraty i wykształcenie naukowe, a często też inżynierskie
Nauka o danych (ang. data science) to zbiór podstawowych zasad, które kierują ekstrakcją wiedzy z danych. Nauka o danych obejmuje zasady, procedury i techniki stosowane w celu zrozumienia zjawiska poprzez analizę danych – często zautomatyzowaną. Specjaliści zajmujący się nauką o danych to naukowcy danych (ang. data scientist)
Nauki o danych nie należy mylić z węższym i nieco starszym pojęciem: eksploracją danych. Eksploracja danych (ang. data mining) to wydobywanie wiedzy z danych za pomocą technologii, które zawierają te zasady. Terminy te są czasem stosowane zamiennie – nie należy jednak tego robić bo eksploracja danych jest dyscypliną praktyczną, nastawioną na szukanie konkretnych odpowiedzi i stawianie rekomendacji do działania. Tymaczasem nauka o danych skupia się bardziej na części teoretycznej, szukaniu zależności, budowaniu modeli i algorytmów. Działania naukowców danych służą bardziej zrozumieniu i proponowaniu nowatorskich rozwiązań.
Dodaj komentarz