dotnetomaniak.pl - Artykuły z tagiem Big Data

Big Data

ksqlDB - magia SQL w czasie rzeczywistym - część 1 - Wiadro Danych

ksqlDB to rozwiązanie z rodziny Apache Kafka i Confluent. Pozwala na wykorzystanie języka SQL do definiowania zadań przetwarzania strumieniowego. Wpis ten zaczyna serię o ksqlDB. Spróbujemy zrobić coś fajnego na podstawie danych z Packetbeat’a (monitoring ruchu sieciowego) i zobaczymy jak to dalej się rozwinie.Spis treścihide1Co to jest ksqlDB?ksqlDB w Cybersecurity?2Problem3ŚrodowiskoApache Kafka + Zookeeper + ksqlDB4Packetbeat5ksqlDBGdzie strumyk płynie z wolnaPrzykładowy rekordStream ‘packetbeat’Strea...

Tagi: apache kafka, Big Data, kafka, ksql, ksqlDB, monitoring, Packetbeat, przetwarzanie strumieniowe, SQL, stream processing

Źródło: wiadrodanych.pl

Dziel się z innymi:

ksqlDB - magia SQL w czasie rzeczywistym - część 1 - Wiadro Danych

Bazy danych i XML 863 dni, 5 godzin, 37 minut temu mszymczyk 48 źrodło rozwiń

Podbij ↑

Apache Kafka – Niezbędne podstawy teoretyczne

Czym właściwie jest Kafka i jakie są jej zastosowania? Zgodnie z definicją jest to platforma przeznaczona głównie do przetwarzania danych strumieniowo. Ciekawostką jest, że projekt zapoczątkowano w LinkedIn, a w późniejszym etapie stał się open-source’owy.

Tagi: Big Data, Broker, kafka

Źródło: pieceofdata.pl

Dziel się z innymi:

Apache Kafka – Niezbędne podstawy teoretyczne

Programowanie rozproszone 940 dni, 6 godzin, 3 minuty temu LukaszIdz 67 źrodło rozwiń

Podbij ↑

Czy potrzebujesz Big Data? – Piece of Data

Pierwszy wpis na blogu i zarazem mój debiut. Co prawda ten artykuł z .NET powiązany nie jest - ale nie wykluczam w przyszłości i takich z pogranicza .NET – Data ;) Każdy feedback będzie mile widziany.

Tagi: Big Data, Programowanie rozproszone

Źródło: pieceofdata.pl

Dziel się z innymi:

Czy potrzebujesz Big Data? – Piece of Data

Programowanie rozproszone 1109 dni, 6 godzin, 47 minut temu LukaszIdz 25 źrodło rozwiń

Podbij ↑

O analityce z Pawłem Potasińskim - Patoarchitekci

Tym razem rozmawiamy z Pawłem Potasińskim o analityce. Przewijają się różne zagadnienia - od klasycznych hurtowni po uczenie maszynowe, kompetencje zespołów data science, co powinni wiedzieć programiści na temat analityki i czego ludzi od danych mogą się nauczyć od programistów.

Tagi: analityka, Big Data, cloud, data warehouse, etl, Spark, SQL

Źródło: patoarchitekci.io

Dziel się z innymi:

O analityce z Pawłem Potasińskim - Patoarchitekci

Architektura 1143 dni, 5 godzin, 43 minuty temu Łukasz Kałużny 27 źrodło rozwiń

Podbij ↑

Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych

Chcemy, aby nasze aplikacje w Apache Spark wykorzystywały wszystkie przydzielone zasoby. Niestety nie jest to takie proste. Rozproszenie obliczeń niesie za sobą koszty zarządzania zadaniami, a same zadania mają wobec siebie zależności. Z jednej strony ogranicza nas CPU (szybkość obliczeń), z drugiej strony dyski i sieć. MapReduce poświęciłem dedykowany materiał wideo. W artykule dowiesz się jak w 2 prostych krokach poprawić utylizację zasobów w Apache Spark.Spis treścihide1Prosta aplikacja2Nie taka prost...

Tagi: apache spark, Big Data, Distributed Processing, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych

Programowanie rozproszone 1143 dni, 5 godzin, 43 minuty temu mszymczyk 13 źrodło rozwiń

Podbij ↑

Big Data - Jak zacząć? - Wiadro Danych

No właśnie. Jak zacząć w świecie Big Data? Przecież tyle tych technologii. Widać to choćby na tym schemacie. http://mattturck.com/wp-content/uploads/2019/07/2019MattTurckBigDataLandscapeFinal_Fullsize.png.Newsletter Amerykańscy naukowcy i radzieccy uczeni są zgodni w jednym: nie ma lepszego sposobu na początek przygody z Big Data, jak subskrypcja Wiadro Danych 😎 Przechodząc dalej, akceptujesz politykę prywatnościJęzyk Oczywiście najważniejszym językiem w IT jest… język angielski. Ale skończmy h...

Tagi: Big Data, docker, hdfs, hdinsight, Java, Python, Scala, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Inne 1443 dni, 6 godzin, 55 minut temu mszymczyk 45 źrodło rozwiń

Podbij ↑

Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych

Delta Lake zdobywa ostatnio coraz większa popularność. Słychać o nim na konferencjach na całym świecie. W tym artykule przyjrzymy się jakie problemy rozwiązuje.Spis treścihide1Co to Delta Lake?2Jupyter + Delta Lake3Przygotowanie danych4Bez Delta Lake5Z Delta LakeHistoria i podróże w czasieZarządzanie schematemVacuumDelta Lake APIDeleteUpdateMergeStreaming Sink6Co jest pod maską?7RepoCo to Delta Lake? Delta Lake to nakładka na Apache Spark. Pełni rolę warstwy persystencji i gwarantuje ACID na HDFS, S3, A...

Tagi: apache spark, Big Data, data lake, Delta, Delta Lake, hdfs, pyspark, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych

Bazy danych i XML 1535 dni, 6 godzin, 1 minutę temu mszymczyk 51 źrodło rozwiń

Podbij ↑

Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data

Dzisiaj wstęp do usługi Data Lake Storage. Czyli ewolucja blob storage stworzona pod analizy narzędziami big data, ale nie tylko. Kilka słów o tym jak działa, pare demek i na koniec łączenie się z Databricks.

Tagi: Azure, Big Data, hadoop

Źródło: youtu.be

Dziel się z innymi:

Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data

Cloud 1595 dni, 6 godzin, 46 minut temu AdamMarczak 30 źrodło rozwiń

Podbij ↑

Problem małych plików w HDFS - Wiadro Danych

Korzystanie z HDFS bardzo przypomina korzystanie ze zwykłego systemu plików z użyciem terminala. Grupy, uprawnienia, pliki, foldery itp. Bawiąc się kolejnymi technologiami Big Data można zapomnieć się i potraktować HDFS jak zwykły dysk.Dane W ostanim wpisie wspomniałem kilkanaście źródeł danych. Na jednym z nich znalazłem Enron Email Dataset. Jest to zbiór maili przedsiębiorstwa energetycznego Enron. Co takiego charakteryzuje ten zbiór? Zawiera dużo małych plików.Jak dużo? Ściągnąłem, rozpakowałem i wy...

Tagi: Big Data, bigdata, hadoop, hdfs

Źródło: wiadrodanych.pl

Dziel się z innymi:

Problem małych plików w HDFS - Wiadro Danych

Bazy danych i XML 1617 dni, 5 godzin, 58 minut temu mszymczyk 36 źrodło rozwiń

Podbij ↑

Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych

W poprzednim wpisie (Big Data to 3 słowa) wspomniałem z jakimi wyzwaniami mierzy się Big Data. Dotyczy to również architektury. Wykorzystywana wcześniej EDW (Enterprise Data Warehouse) nie pasuje do nowych standardów. Opracowano nową architekturę o bardzo obrazowej nazwie Data Lake (dosłownie Jezioro Danych). Wyobraź sobie te wszystkie górskie potoki (nazwa strumień danych nie wygląda na przypadkową), które spływają do jeziorka z którego wszyscy korzystają… ale najpierw przyjrzyjmy się co było nie tak w ...

Tagi: architecture, architektura, Big Data, data lake

Źródło: wiadrodanych.pl

Dziel się z innymi:

Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych

Architektura 1666 dni, 7 godzin, 34 minuty temu mszymczyk 67 źrodło rozwiń

Podbij ↑

Big Data to 3 słowa - Wiadro Danych

Co to jest w ogóle Big Data? Słyszymy o systemach Big Data, technologiach Big Data, rozwiązaniach Big Data… a nawet o systemach klasy Big Data. Jest to trochę takie słowo wytrych, buzzword które nabrało popularności i się „sprzedaje”. Poniżej opisałem to co kryje się pod tym terminem według mnie. Termin Big Data najczęściej kojarzony jest z technologią Hadoop, czyli podejściem do rozproszonego przetwarzania danych wykorzystującego technikę MapReduce. Czy Hadoop to Big Data? Nie, nie tylko. Jak widać np....

Tagi: Big Data, hadoop

Źródło: wiadrodanych.pl

Dziel się z innymi:

Inne 1669 dni, 6 godzin, 56 minut temu mszymczyk 68 źrodło rozwiń

Podbij ↑

Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog

Ciężko czyta się grafy w postaci tekstowej. Znacznie lepsze jest do tego pismo pierwotne jakim są obrazki. Jeśli miałeś kiedyś problem z wizualizacją grafu w bibliotece GraphFrames na Apache Zeppelin to zapraszam do zerknięcia w kod.

Tagi: Big Data, Graf, graph, GraphFrames, Spark, Wizualizacja

Źródło: www.mszymczyk.com

Dziel się z innymi:

Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog

Bazy danych i XML 1806 dni, 7 godzin, 21 minut temu mszymczyk 32 źrodło rozwiń

Podbij ↑

Data scientist – nowy zawód na nowe czasy

Kim jest data scientist? Co to za twór? Jakie języki programowania warto znać, aby pracować w świeżej gałęzi IT - czyli data science?

Tagi: Big Data, Data science, data scientist, Python, SQL

Źródło: www.dobreprogramy.pl

Dziel się z innymi:

Data scientist – nowy zawód na nowe czasy

Bazy danych i XML 2033 dni, 6 godzin, 10 minut temu djfoxer 79 źrodło rozwiń

Podbij ↑

DevReview #3 O Big Data z Hubertem Chylikiem i Jackiem Byliną - Forever F[r]ame

Dzisiejszy odcinek jest dość nietypowy, ponieważ goszczę aż dwie osoby. A są to moi dobrzy znajomi z czasów studenckich: Huber Chylik oraz Jacek Bylina. Obaj programiści oraz miłośnicy dość świeżego „trendu” jakim jest Big Data. I to właśnie ten temat został poruszony w dzisiejszym odcinku Chłopaki powiedzieli co określa się mianem Big Data, jakie narzędzia i środowiska ułatwiają przetwarzanie i analizę dużych zbiorów danych oraz przedstawili kilka autorskich przykładów wykorzystania tej technologi, któ...

Tagi: Big Data, podcast

Źródło: foreverframe.pl

Dziel się z innymi: