Książki, poradniki, ebooki, audiobooki -
Spark. Błyskawiczna analiza danych. Wydanie II

header_top2.png

Promocja tygodnia

50% taniej na książki informatyczne !
Co tydzień inna książka.

Promocja tygodnia o 50%

Taniej na książki klasy business !
Co tydzień inna książka.

Promocja tygodnia 50%

Taniej na książki "Sztuka życia" !
Co tydzień inna książka.

Promocja tygodnia - 50%

Taniej na książki z serii Poradniki !
Co tydzień inna książka.

Jesteś tutaj:

Książki informatyczne

Inne bazy danych

Spark. Błyskawiczna analiza danych. Wydanie II

sparb2Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wybór dla programistów zajmujących się big data, a także eksploracją i analizą danych.

To książka przeznaczona dla inżynierów danych i programistów, którzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytmów uczenia maszynowego, nawet jeśli te dane pochodzą z różnych źródeł.

Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Omówiono również współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach.

W książce:

  • API strukturalne dla Pythona, SQL, Scali i Javy,
  • operacje Sparka i silnika SQL,
  • konfiguracje Sparka i interfejs Spark UI,
  • nawiązywanie połączeń ze źródłami danych: JSON, Parquet, CSV, Avro, ORC, Hive, S3
    i Kafka,
  • operacje analityczne na danych wsadowych i strumieniowanych,
  • niezawodne potoki danych i potoki uczenia maszynowego.

Spark: twórz skalowalne i niezawodne aplikacje big data!

 

Jules S. Damji - jest inżynierem oprogramowania dla wielu wiodących firm, takich jak Netscape, Sun Microsystems, Verisign i ProQuest. Zajmuje się systemami rozproszonymi.

Brooke Wenig - kieruje zespołem, który opracowuje potoki uczenia maszynowego. Prowadzi też szkolenia z zakresu rozproszonego uczenia maszynowego.

Tathagata Das - jest członkiem Apache Spark Project Management Committee. Pracuje nad strumieniowaniem strukturalnym i Delta Lake.

Denny Lee - zajmuje się systemami rozproszonymi i inżynierią danych, zwłaszcza dla branży ochrony zdrowia.

 

Kup teraz

Pobierz darmowy fragmentpdf icon2Rozmiar: 2,7 MB

Promocje eBooki

Codziennie promocja
innej książki !

Kursy video IT

Kursy video z serii IT

Biznes IT

Książka z serii Biznes IT

Programowanie

Książka z serii
Programowanie

Webmasterstwo

Wybrane książki z serii
Webmasterstwo

Grafika

Książka z serii
Grafika komputerowa

O zdrowiu

Przez żołądek do serca

Przez żołądek do serca

“PRZEZ ŻOŁĄDEK DO SERCA”WYPRÓBUJ SPRAWDZONE SPOSOBY NA ŻYCIEW PEŁNYM ZDROWIU I... MIŁOŚCI Do Marka Zaremby każdego roku zgłaszają się tysiące ludzi po porady z zakresu dietetyki, zdrowego stylu życia, stosowania postu,...

Więcej w : Zdrowe odżywianie

Czytaj więcej...

Biznes i kariera

Moja Pasja Moją Firmą

Moja Pasja Moją Firmą

Słynne jest już hasło "Jeśli robisz to co kochasz, to nie przepracujesz ani jednego dnia" głoszone przez przedsiębiorców-pasjonatów. Problem polega jednak na tym, że o ile twoją pasją nie jest...

Więcej w : Własna firma

Czytaj więcej...
Designed by :