Przejdź do treści
Logo Polsko-Japońskij Akademii Technik

Informacje ogólne

Organizacja zajęć

Zajęcia realizowane są w formule hybrydowej, łączącej wykłady prowadzone zdalnie online na platformie Microsoft Teams z ćwiczeniami odbywającymi się stacjonarnie.

Harmonogram zajęć został zaplanowany w sposób ułatwiający organizację nauki osobom pracującym – jeden dzień każdego dwudniowego zjazdu odbywa się zdalnie, a drugi stacjonarnie.

W trybie stacjonarnym realizowane są również zaliczenia oraz egzaminy zerowe podczas ostatniego zjazdu.

Program studiów obejmuje dwa semestry i łącznie 210 godzin dydaktycznych, w tym 120 godzin zajęć praktycznych.

Wykłady realizowane online są nagrywane i udostępniane słuchaczom jako materiały wspierające naukę i powtórkę treści.

Zajęcia oraz materiały dydaktyczne prowadzone są w języku polskim.


Wartość dodana

Harmonogram zajęć jest ułożony tak, aby jeden dzień z każdego dwudniowego zjazdu był zdalnie (sobota lub niedziela), a drugi stacjonarnie, co bardzo usprawnia logistykę osób dojeżdżających na studia. Dodatkowym atutem takiego podziału zajęć są nagrane wykłady, które stanowią wartościową bazę materiałów wykorzystywanych do nauki treści oferowanych podczas kształcenia.


Program studiów

Program studiów 2025/2026


Program studiów 2024/2025

Program studiów 2023/2024

Program studiów 2022/2023


Podstawy inżynierii dużych zbiorów danych
  • Inżynieria danych
  • Data Science, Big Data, Data Analysis
  • Uczenie maszynowe i Deep Learning
  • Algorytm MapReduce
  • Model BigTable
  • Rozwiązania sprzętowe
Infrastruktura sprzętowa w przetwarzaniu dużych zbiorów danych
  • Big Data na laptopie lub komputerze stacjonarnym
  • Big Data na klastrze lokalnym
  • Realizacje w Chmurze
  • Zastosowanie procesorów graficznych
  • Wykorzystanie NVIDIA Tesla Deep Learning
Analiza danych w języku Python
  • Przygotowanie środowiska dla programisty (Rodeo)
  • Podstawy języka Python
  • Wyrażenia regularne w języku Python
  • Przegląd bibliotek naukowych: NumPy, SciPy, Matplotlib
  • Wizualizacja danych
  • Uczenie maszynowe i Sickit Learn
Nierelacyjne bazy danych
  • Koncepcja baz NoSQL
  • Reprezentacje danych w bazie Cassandra
  • Interfejsy do baz Cassandra i HBase
  • Środowisko Apache Hadoop na potrzeby baz NoSQL
  • Reprezentacje danych w bazie HBase
  • Baza HBase i Hadoop
Przetwarzanie dużych zbiorów danych w chmurze obliczeniowej
  • Ekosystem Microsoft Azure
  • Silnik Microsoft Azure Machine Learning
  • Narzędzie Azure Machine Learning Studio
  • Rozwiązanie przykładowego problemu
Konfiguracja środowiska przetwarzania dużych zbiorów danych
  • Apache Cassandra
  • Apache HBase
  • Apache Spark
  • Apache Mahaut
  • Apache MLlib
  • Apache Hadoop
Infrastruktura programowa w przetwarzaniu dużych zbiorów danych
  • Rozwiązania Open Source (Apache)
  • Rozwiązania komercyjne (SAS, Google, Microsoft)
  • Silnik Microsoft Azure i Machine Learning Tool
  • Silnik Cloud Analytics Services (CAS)
  • Silnik Google Cloud Machine Learning Engine
Analiza danych w języku R
  • Przygotowanie środowiska programisty (RStudio)
  • Podstawy języka skryptowego R
  • Wizualizacja danych w R
  • Obliczenia stacjonarne z wykorzystaniem R
  • Obliczenia w chmurze
  • Przegląd pakietów R
Metody uczenia maszynowego
  • Związek Big Data z uczeniem maszynowym
  • Apache Spark i biblioteka MLlib
  • Apache Mahaut w zadaniach klasyfikacyjnych
  • Podstawowe algorytmy uczenia maszynowego
Projekt własny
  • Wybór problemu
  • Samodzielna implementacja oraz rozwiązanie problemu

Poznaj zespół Centrum Kształcenia Podyplomowego

Nikt nie opowie o studiach podyplomowych oferowanych przez Centrum Kształcenia Podyplomowego lepiej niż ich twórcy. Zapraszamy do wysłuchania paru słów dyrektora Centrum Kształcenia Podyplomowego, Pani Marty Godzisz, która opowie, dlaczego nasze studia podyplomowe są wyjątkowe.