Uczenie maszynowe
Potoki danych. Leksykon kieszonkowy. Przenoszenie i przetwarzanie danych na potrzeby ich analizy
- Szczegóły
- Kategoria: Uczenie maszynowe
Poprawnie zaprojektowane i wdrożone potoki danych mają kluczowe znaczenie dla pomyślnej analizy danych, a także w trakcie uczenia maszynowego. Pozyskanie ogromnych ilości danych z różnych źródeł najczęściej nie stanowi problemu. Nieco trudniejsze jest zaprojektowanie procesu ich przetwarzania w celu dostarczenia kontekstu w taki sposób, aby efektywnie korzystać z posiadanych danych w codziennej pracy organizacji i podejmować dzięki nim rozsądne decyzje.
Oto zwięzły przewodnik przeznaczony dla inżynierów danych, którzy chcą poznać zasady implementacji potoków danych. Wyjaśnia najważniejsze pojęcia związane z potokami danych, opisuje zasady ich tworzenia i implementacji, prezentuje także najlepsze praktyki stosowane przez liderów w branży analizy danych. Dzięki książce zrozumiesz, w jaki sposób potoki danych działają na nowoczesnym stosie danych, poznasz też typowe zagadnienia, które trzeba przemyśleć przed podjęciem decyzji dotyczących implementacji.
Dowiesz się, jakie są zalety samodzielnego opracowania rozwiązania, a jakie - zakupu gotowego produktu. Poznasz również podstawowe koncepcje, które mają zastosowanie dla frameworków typu open source, produktów komercyjnych i samodzielnie opracowywanych rozwiązań.
Dowiedz się:
- czym jest potok danych i na czym polega jego działanie,
- jak się odbywa przenoszenie i przetwarzanie danych w nowoczesnej infrastrukturze,
- jakie narzędzia są szczególnie przydatne do tworzenia potoków danych,
- jak używać potoków danych do analizy i tworzenia raportów,
- jakie są najważniejsze aspekty obsługi potoków, ich testowania i rozwiązywania problemów.
Poznaj najlepsze praktyki projektowania i implementacji potoków danych!
James Densmore jest dyrektorem do spraw infrastruktury danych na potrzeby analityki biznesowej w HubSpot, a także założycielem i głównym konsultantem w Data Liftoff. Od ponad dziesięciu lat kieruje zespołami inżynierów danych i zajmuje się projektowaniem infrastruktury danych.
- Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku - [13 luty 2024]
- Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym - [26 październik 2023]
- Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP - [16 sierpień 2023]
- Podręcznik architekta rozwiązań. Poznaj reguły oraz strategie projektu architektury i rozpocznij niezwykłą karierę. Wydanie II - [01 sierpień 2023]
- Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III - [04 lipiec 2023]