Data Science i Big Data w Zarządzaniu 

STUDIA REALIZOWANE WE WSPÓŁPRACY Z 

Minikonferencja Big Data i Data Science w Zarządzaniu 15.12.2017r. 

Więcej o tym spotkaniu: http://www.sages.com.pl/data-science-w-zarzadzaniu/

KIEROWNIK STUDIÓW 

Łukasz Kobyliński
Chief Science Officer w Sages oraz Lead Data Scientist w SigDelta. Doświadczony ekspert z zakresu analizy danych i uczenia maszynowego oraz manager z wieloletnim stażem. Uzyskał stopień doktora nauk technicznych na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej zajmując się tematyką eksploracji dużych baz zawierających obrazy. Prowadził projekty oraz zajęcia na studiach magisterskich i podyplomowych. Od roku 2008 zajmuje się przetwarzaniem języka naturalnego prowadząc projekty w Zespole Inżynierii Lingwistycznej IPI PAN. Brał między innymi udział w projektach: Narodowy Korpus Języka Polskiego, którego rezultatem jest największy polski korpus językowy, NEKST, w wyniku którego powstała innowacyjna wyszukiwarka semantyczna działająca na dużych danych oraz międzynarodowym projekcie Common Language Resources & Technology Infrastructure (CLARIN).
Wieloletni trener i konsultant oraz prelegent na konferencjach naukowych i informatycznych. Prowadził szkolenia i konsultacje w firmach z branży finansowej, ubezpieczeniowej oraz IT. Autor publikacji z dziedziny analizy obrazów, eksploracji baz danych, uczenia maszynowego oraz przetwarzania języka natralnego. Członek Rady Programowej studiów podyplomowych Big Data realizowanych przez firmę Sages oraz Politechnikę Warszawską oraz opiekun merytoryczny bootcampów Kodołamacz.pl.

O STUDIACH

Po pierwszym okresie gwałtownego wzrostu zainteresowania koncepcją Big Data, które miało miejsce około 2011 roku, pojawiły się również pierwsze rozczarowania, naturalne w kontekście braku dojrzałości stosowanych metod, stawianych celów, czy oczekiwań. Pierwotny etap koncentracji na gromadzeniu wszelkich danych, w nadziei na to, że da się je sensownie wykorzystać, zakończony został refleksją, że bez sprecyzowanego pomysłu na spożytkowanie tych danych nie przynosi to istotnych korzyści biznesowych, a jedynie zwiększa koszty działalności, ze względu choćby na konieczność wdrożenia skomplikowanej infrastruktury.

Częściową odpowiedzią na problem braku realnych korzyści biznesowych z wdrażanych rozwiązań Big Data była identyfikacja wiedzy - wcześniej nieznanej oraz interesującej z punktu widzenia danej organizacji - jako kluczowego elementu projektów opartych na analizie dużych danych. Odkrycie interesującej wiedzy powinno być celem wyznaczającym poszczególne zadania w projektach Big Data, determinującym zakres zbieranych danych i niezbędną infrastrukturę. Powoduje też konieczność utworzenia zupełnie nowej roli w zespołach projektowych, a mianowicie stanowiska Data Scientist. Stanowisko to łączy wiele umiejętności, takich jak statystyka, programowanie, uczenie maszynowe, ale przede wszystkim wymaga znajomości dziedziny biznesowej i nastawione jest na dostarczanie korzyści biznesowych (patrz http://www.sages.com.pl/blog/kim-jest-data-scientist-i-jak-nim-zostac/).
Obecnie jest to jeden z zawodów cieszących się ogromnym zapotrzebowaniem na rynku; wiele firm posiada już całe działy Data Science.

Okazuje się jednak, że obecnie mamy do czynienia z kolejną falą rozczarowania projektami z zakresu Big Data, ze względu na brak doświadczeń i dobrych praktyk związanych z zarządzaniem projektami tego typu. Coraz bardziej zauważalne jest, że prawdziwe wyzwanie nie leży po stronie - zdawałoby się - obiektywnie trudnej materii, związanej z budowaniem modeli, czy tworzeniem efektywnych, skalowalnych algorytmów, a po stronie zarządzania właśnie.

Wśród licznych bolączek projektów z zakresu Big Data Harvard Business Review wskazuje między innymi na naturalny rozdźwięk między potrzebą naukowca, kim w zasadzie jest Data Scientist, jaką jest opracowywanie nowych, wyrafinowanych metod, a potrzebą szybkiej weryfikacji wielu hipotez, podyktowaną właśnie potrzebą biznesową (https://hbr.org/2016/12/why-youre-not-getting-value-from-your-data-science). Uogólnić to można do stwierdzenia, iż Data Scientiści nie czują, że ich główną odpowiedzialnością jest dostarczanie wartości, a zarządzanie ich projektami daleko się ma od podejść Agile, czy Lean (http://dsianalytics.com/150-data-scientists-still-no-business-value/).

Zmiany które dotknęły w ubiegłej dekadzie programistów, a które zaskutkowały między innymi Agile Manifesto, czy Software Craftsmanship Manifesto, nie dotknęły Data Scientistów, bo ich jeszcze zwyczajnie nie było. Wiemy jednak, że nie są to problemy nie do rozwiązania od strony metod zarządzania, trzeba jednak je świadomie zaadresować. Z drugiej strony, nalezy też poszukać powodów po stronei biznesowej i jasno powiedzieć, że wartość pojawić się może wówczas, gdy zarządzanie w oparciu o dane stranie się jednym z filarów strategii firmy (http://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/The-age-of-analytics-Competing-in-a-data-driven-world oraz hbr.org/2017/06/how-to-integrate-data-and-analytics-into-every-part-of-your-organization
).

Tymczasem niestety obserwuje się często,że managerowie, mając zbyt powierzchowną wiedzę w zakresie Data Science, izolują tego rodzaju działy, uważając, że przedmiot ich działalności jest zbyt abstrakcyjny i oderwany od rzeczywistości, nie dopuszczając ich do faktycznie istotnych biznesowo problemów, albo nie zapewniając im odpowiedniego wsparcia do ich realizowania. Wynika to często z tego, że nie rozumieją co jest kluczowe dla sukcesu takiego przedsięwzięcia, albo jak uzasadnić biznesowo sens alokacji określonych środków. Są to gigantyczne problemy dojrzałych organizacji, ale są również istotne dla mniejszych przedsiębiorstw, które nie są w stanie rozpocząć projektów związanych z analizą dużych danych w sposób efektywny kosztowo i leżący w ich zasięgu realizacyjnym.

Podsumowując, właściwe zrealizowana transformacja biznesowa, adekwatna struktura organizacyjna, skuteczne sposoby pracy działów Data Science, a także wysoka świadomość managerów co do tego jakie są dostępne możliwości oraz jak definiować cele jest faktycznym kluczem do sukcesu.

Proponowane studia prowadzone są zarówno przez ścisłych ekspertów w zakresie Data Science, jak i osoby z biznesu, które miały okazję przecierać szlaki we wdrażaniu strategii Data Science oraz Big Data w Polsce.

Takie połączenie ma na celu dostarczenie kadrze managerskiej holistycznego spojrzenia na  wyzwania związane z tymi zagadnieniami, w tym z kluczowej perspektywy biznesowej oraz praktycznych, twardych kompetencji wykorzystywanych w kierowaniu działem lub przedsiębiorstwem. W szczególności, celem jest przekazanie wiedzy w zakresie specyfiki dużych danych, integracji i gromadzenia danych z różnych źródeł oraz architektury rozwiązań klasy Big Data, podanej w sposób przystępny dla osób nieposiadających wykształcenia technicznego, czy  statystycznego.  Studia mają na celu pomóc zarówno tym, którzy są już w procesie transformacji, jak i tym, którzy chcieliby poznać co ich potencjalnie czeka w przyszłości, jeśli ich organizacja zdecyduje się pójść tą drogą.

WIODĄCY WYKŁADOWCY 

Kadra dydaktyczna składa  się z osób z wieloletnią praktyką w pracy w dziedzinie Big Data i Data Science oraz szkoleń z dziedziny IT, a także z zaproszonych gości pełniących funkcje managerskie  w różnych branżach.

DOMINIK BATORSKI

Socjolog i data scientist łączący pracę naukową w Interdyscyplinarnym Centrum Modelowania Matematycznego i Komputerowego (ICM) na Uniwersytecie Warszawskim z działalnością doradczą i biznesową. Ma kilkunastoletnie doświadczenie w analizie dużych danych, przede wszystkim zbieranych przez serwisy internetowe i firmy telekomunikacyjne, m.in. zakładał i do 2010 rozwijał dział business intelligence w Gadu-Gadu. Jest współtwórcą Sotrender’a firmy tworzącej narzędzia analityczne do monitoringu i optymalizacji marketingu w mediach społecznościowych w oparciu o dane. Od 2014 roku organizuje comiesięczne spotkania Warsaw Data Science Meetup, które służą wymianie wiedzy i integracji społeczności około 3tys. osób zajmujących się pracą z danymi.
Naukowo zajmuje się m.in. badaniem zmian społecznych i gospodarczych związanych z upowszechnieniem technologii informacyjno-komunikacyjnych, a także sposobów korzystania z technologii i zachowań użytkowników. Jest współautorem badań Diagnoza społeczna. Specjalizuje się również w badaniach sieci społecznych, oraz procesów zachodzących w sieciach, takich jak dyfuzja innowacji czy wpływ społeczny.
Posiada wieloletnie doświadczenie w doradzaniu jednostkom administracji rządowej i samorządowej, kierował przygotowywaniem kilkunastu opracowań analitycznych i ekspertyz oraz uczestniczył w tworzeniu Strategii i Programów Operacyjnych. Obecnie jest członkiem Rady ds. Cyfryzacji przy Ministrze Cyfryzacji.

MARCIN CHOIŃSKI

Absolwent Wydziały Elektroniki i Technik Informacyjnych Politechniki Warszawskiej.
Pasjonat wszystkiego co związane z Hurtowniami Danych, BI, Big Data, Data Science oraz Analityką Biznesową. Posiada wieloletnie doświadczenie w budowaniu i wdrażaniu rozwiązań klasy DW/BI, Data Mining oraz Data Management m. in. dla globalnych i regionalnych korporacji z branż farmaceutycznej i telekomunikacyjnej. Uprzednio również założyciel i redaktor portalu BI.PL, wykładowca w Wyższej Szkole Promocji, trener, główny analityk danych w zespole futbolu amerykańskiego Warsaw Eagles. Obecnie odpowiedzialny za rozwój ekosystemu analitycznego Big Data i Data Science w TVN Digital. Hobbystycznie buduje modele analityczne w obszarze sportu, albo wędkuje.

PIOTR NAZIMEK

Absolwent Wydziału Elektroniki i Technik Informacyjnych Politechniki Warszawskiej, gdzie w 2012 roku obronił doktorat z obszaru niezawodności systemów komputerowych. Zakres jego zainteresowań obejmuje szeroko pojęte bezpieczeństwo oraz inżynierię oprogramowania. Bierze udział w projektach systemów transakcyjnych związanych z płatnościami elektronicznymi oraz transportem. Prowadzi szkolenia z zakresu praktycznego stosowania kryptografii w systemach komputerowych. Od 2016 roku jest wykładowcą na pierwszych w Polsce technicznych studiach Big Data realizowanych przez firmę Sages oraz Politechnikę Warszawską.

JAKUB NOWACKI

Absolwent Politechniki Gdańskiej oraz Uniwersytetu Bristolskiego, gdzie obronił doktorat z matematyki stosowanej. Na co dzień łączy umiejętności analityczne i programistyczne jako Data Scientist. Doświadczenie zdobywał oraz prowadził zespoły w działach badań i rozwoju w wielu firmach w branży wysokich technologii, mediów, farmaceutycznych oraz petrochemicznych. Najbardziej interesuje się rozproszonym przetwarzaniem i analizą dużych zbiorów danych wspomagające decyzje w biznesie i w badaniach, oraz automatyzujące procesy w przedsiębiorstwach. Pracował zarówno z technologiami dojrzałymi, jak i nie boi się wyzwań w pracy z najnowszymi rozwiązaniami. Zwolennik pragmatycznego użycia technologii w biznesie. Prelegent na wielu konferencjach poświęconych tematyce Big Data. Trener szkoleń technologicznych z zakresu Big Data współpracujący z Sages. Lead Data Scientist w firmie Sigdelta. Od 2016 roku dzieli się zdobytą wiedzą jako wykładowca na pierwszych w Polsce technicznych studiach Big Data realizowanych przez firmę Sages oraz Politechnikę Warszawską.

PIOTR RESZKA

CEO Astrafox, absolwent Inżynierii Oprogramowania PW. Ekspert Visual Data Science, praktyk z bogatym doświadczeniem wdrożeń BI/ERP w Polsce i USA. Na co dzień Piotr i jego zespół pomagają Klientom we wszystkich aspektach pracy z narzędziami Business Intelligence: od projektowania KPI, przygotowywania danych, poprzez szkolenia, warsztaty, aż po zaawansowane programowanie i integrację. “Jak większość analityków poszukiwałem rozwiązań pozwalających skupić się na potrzebach biznesowych a nie technologii. Wtedy odkryłem moc analizy i wizualizacji w narzędziach takich jak Tableau dzięki którym praca z danymi jest przyjemniejsza i pozwala na szybkie wyciąganie wniosków oraz podejmowanie właściwych decyzji zmieniających biznes. Moją pasją jest robotyka i astrofizyka ale zasypiając, liczę owce używając Count Distinct…”

RADOSŁAW SZMIT

Absolwent Politechniki Warszawskiej, gdzie aktualnie pracuje nad doktoratem z zakresu Big Data i przetwarzania języka naturalnego.
Swoją praktykę z Big Data rozpoczął na początku 2012 roku w projekcie badawczym realizowanym przez Instytut Podstaw Informatyki Polskiej Akademii Nauk oraz Politechnikę Wrocławską. Do dzisiejszego dnia jest to jedno z największych wdrożeń Big Data w Polsce. W ramach projektu zbudowany został klaster Apache Hadoop, w którym są zbierane i analizowane zasoby polskiego internetu. Jednym z systemów powstałych w ramach powyższego projektu jest pierwsza polska semantyczna wyszukiwarka internetowa.
Aktualnie jest członkiem zespołu rozwijającego Otwarty System Antyplagiatowy realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji, które zrzesza czołowe polskie uczelnie. W ramach projektu analizuje duże zbiory danych w celu odnalezienia wszelkich form nadużyć i łamania prawa autorskiego w sprawdzanych pracach. Projekt jest tworzony przy współpracy z Instytutem Podstaw Informatyki Polskiej Akademii Nauk oraz Poznańskiego Centrum Superkomputerowo-Sieciowego będącego jednym z największych centrów obliczeniowych w Polsce.
W ramach praktyki zawodowej uczestniczył także w wielu projektach z zakresu Big Data oraz Business Intelligence realizowanych dla wiodących firm z branży bankowości, e-comerce oraz mediów. Jednym z rozwijanych rozwiązań był system trackingowy służący do śledzenia i analizowania aktywności związanej z reklamami zamieszczonymi na popularnych portalach internetowych.
Dzieli się zdobytą wiedzą w ramach szkoleń komercyjnych oraz jest wykładowcą na pierwszych w Polsce technicznych studiach Big Data realizowanych przez firmę Sages oraz Politechnikę Warszawską.

ANNA WRÓBLEWSKA

Absolwentka Wydziału Elektroniki i Technik Informacyjnych Politechniki Warszawskiej, w roku 2008 otrzymała na tej uczelni tytuł doktora nauk technicznych w zakresie informatyki. Pracowała na stanowisku adiunkta w Zakładzie Systemów Informacyjnych Instytutu Informatyki Politechniki Warszawskiej. Prowadziła także projekty studenckie, prace magisterskie i inżynierskie, wykłady z zakresu eksploracji danych tekstowych. Posiada kilkuletnie doświadczenie w projektowaniu inteligentnych systemów analizy i opisu semantycznego danych nabyte w środowisku komercyjnym i naukowym. Obecnie pracuje na stanowisku ekspert analizy danych (Senior Data Scientist) w firmie Allegro – największym portalu e-commerce w Europie Wschodniej, gdzie zajmuje się metodami analizy danych, także tekstowych i obrazowych. Prowadzi zajęcia na studiach podyplomowych Data Science na Wydziale Elektroniki PW. Ponadto jest autorką ponad 35 publikacji w polskich i międzynarodowych czasopismach i materiałach konferencyjnych. Jej zainteresowania naukowe koncentrują się wokół uczenia maszynowego w praktycznych zastosowaniach, w tym przede wszystkim semantycznego rozumienia danych: tekstu i obrazu, wyszukiwania semantycznego, eksploracji tekstu, uczenia i budowania ontologii.

LILIANA PIĘTA

Absolwentka kierunku informatyka i ekonometria na Uniwersytecie Ekonomicznym w Krakowie z kilkuletnim doświadczeniem w analizie danych i obszarze data science. Od początku pracy zawodowej związana z branżą mediową i e-commerce, początkowo pracowała jak analityk danych w Onecie, potem w firmie konsultingowej McKinsey jako analityk statystyczny pomagając niemieckim klientom w transformacjach w obszarze marketingu i sprzedaży. Aktualnie jako Data Scientist w Allegro - największej platformie ecommerce w Polsce - pracuje głównie w obszarze testów A/B, przetwarzania obrazów i tekstu. Prowadzi również zajęcia na studiach podyplomowych Data Science na Wydziale Elektroniki PW. W wolnym czasie wspina się po górach i zwiedza świat.

CEL STUDIÓW 

Celem studiów jest dostarczenie kadrze managerskiej holistycznego spojrzenia na całość zagadnień związanych z Big Data i Data Science oraz praktycznych kompetencji w wykorzystaniu ich w kierowaniu działem lub przedsiębiorstwem, a w szczególności wiedzy w zakresie specyfiki dużych danych, integracji i gromadzenia danych z różnych źródeł oraz  architektury rozwiązań klasy Big Data.

KORZYŚCI DLA UCZESTNIKÓW 

Uczestnicy zdobędą wiedzę na temat analizy danych w oparciu o zaawansowane metody Data Science, a także umiejętności ich wykorzystywania w podejmowaniu skuteczniejszych decyzji biznesowych. Poznają także konkretne narzędzia BI i wizualizacji danych. Uczestnicy dowiedzą się jak zaplanować i skutecznie zrealizować transformację przedsiębiorstwa w przedsiębiorstwo oparte na danych (data-driven business), a także jak zorganizować i zarządzać niezbędną infrastrukturą.

Po studiach uczestnik posiądzie kompetencje pozwalające:
  • skutecznie prowadzić projekty o charakterze BigData i Data Science
  • skutecznie przeprowadzić transformację przedsiębiorstwa/działu w stronę przedsiębiorstwa opartego o analizę danych
  • organizować i zarządzać infrastrukturą Big Data i Data Science
  • wykorzystać wyniki analizy danych w zarządzaniu przedsiębiorstwem
W trakcie studiów pozna:
  • w jaki sposób Big Data i Data Science zmieniają współczesne organizacje
  • metody statystyczne i ich zastosowania w analizie danych
  • zastosowanie metod Data Science w analizie danych, proces analizy danych, jego etapy
  • różnice w podejściach opartych na statystyce i na metodach uczenia maszynowego
  • sposoby konstrukcji zespołów Data Science / Big Data, ich relacje do innych zespołów i rolę managera w zespole Data Science
  • kryteria sukcesu projektu Data Science / Big Data
  • strategie zarządzania danymi oraz zagrożenia związane z ich bezpieczeństwem
  • wybrane dostępne na rynku narzędzia do wizualizacji danych i narzędzia Business Intelligence i ich zastosowanie w przedsiębiorstwie
  • rozwiązania i platformy technologiczne związane z Big Data
Po studiach uczestnik będzie potrafił:
  • konstruować i mierzyć modele
  • rozpoznawać czy na podstawie zestawu danych można uzyskać odpowiedź na zadane pytanie
  • posługiwać się narzędziami do analizy danych
  • posługiwać się wybranymi narzędziami do wizualizacji danych i narzędziami Business Intelligence
  • zaprezentować wyniki analizy danych
  • szacować koszty związane z realizacja projektu Big Data i utrzymaniu infrastruktury Big Data
  • ustanowić politykę bezpieczeństwa danych
  • ustanowić politykę zarządzania danymi

ADRESACI STUDIÓW 

Średnia i wyższa kadra managerska, z co najmniej 3 letnim łącznym stażem zawodowym. Pełniące swoje funkcje m.in. (ale nie wyłącznie) w obszarach marketingu, finansów, IT, zarządzania łańcuchem produkcji, HR, zarządzanie strategiczne.

WARUNKI UKOŃCZENIA STUDIÓW 

Warunkiem ukończenia  jest zaliczenie  wszystkich przedmiotów oraz napisanie i obrona pracy końcowej indywidualnej lub zespołowej. 


Kontakt: 
Izabela Obszańska

Doradca edukacyjny