Zákaznická linka 556 706 203 (Po - Pá: 8 - 16.30 hod.)

Školení Strojové učení nad velkými daty

Cílem tohoto kurzu je představit různé nástroje a koncepty ze strojového učení nad velkými daty. Po dokončení tohoto kurzu by měli účastníci být schopni říct jaký nástroj použít pro daný problém, zjistit jestli neexistuje jednodušší řešení a znát časté chyby a umět se jim vyhnout. [Kód kurzu: AM1408]  Více informací...
Výrobce: MLC
*
3 990 Kč bez DPH

Prerekvizity

  • Základy práce v Pythonu a v nástroji Google Colab
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Co si účastník odnese
Cílem tohoto kurzu je představit různé nástroje a koncepty ze strojového učení nad velkými daty. Po dokončení tohoto kurzu by měli účastníci být schopni říct jaký nástroj použít pro daný problém, zjistit jestli neexistuje jednodušší řešení a znát časté chyby a umět se jim vyhnout. Speciální pozornost věnujeme Sparku jakožto univerzálnímu nástroji, který lze použít jak pro zpracování velkých dat, tak pro ML nad velkými daty.

[Kód kurzu: AM1408]

1denní kurz | 9:00 - 17:30

Jazyk: Česky
Úroveň: intermediate

Osnova školení:

  1. Přehled konceptů a nástrojů ve zpracování velkých dat
    • Od malých k velkým datům a odhad jejich hodnoty
    • Řádkové a sloupcové databáze
    • HDFS (Hadoop Distributed File System)
    • Formáty dat – Parquet, ORC, Avro
    • Komprese – gzip, snappy, zstd
    • SQL databáze – BigQuery, Redshift, Clickhouse, Snowflake, Vertica
  2. Praktický příklad na srovnání malých a velkých dat
  3. Úvod do Sparku
    • MapReduce
    • Spark Computing Engine a RDDs (Resilient Distributed Datasets)
    • DataFrames
    • Spark ekosystém
    • Nejčastější chyby
    • Kde pustit Spark
    • Alternativy – Apache Beam (Dataflow), Dask, lambdas
  4. Praktický příklad se Sparkem
  5. ML strategie pro velká data
    • Inkrementální učení
    • Dávkové učení pro neuronové sítě
    • Distribuované trénování
    • Federated learning
    • Alternativní strategie
      • Náhodné vzorkování
      • Podmodely
      • Větší výpočetní kapacity
  6. Frameworky
    • Scikit-learn a partial_fit
    • MLlib
    • Dask-ML
  7. Praktické příklady s frameworky
  8. Nejčastějsí chyby

Možnosti ubytování a parkování

Dosažená ocenění

Microsoft AEP jsme ESET Partner Centrum Microsoft Partner Microsoft SBS Citrix Adobe Partner