dotnetomaniak.pl - Artykuły z tagiem Big Data

1

Podbij ↑

ksqlDB - magia SQL w czasie rzeczywistym - część 1 - Wiadro Danych

ksqlDB to rozwiązanie z rodziny Apache Kafka i Confluent. Pozwala na wykorzystanie języka SQL do definiowania zadań przetwarzania strumieniowego. Wpis ten zaczyna serię o ksqlDB. Spróbujemy zrobić coś fajnego na podstawie danych z Packetbeat’a (monitoring ruchu sieciowego) i zobaczymy jak to dalej się rozwinie.Spis treścihide1Co to jest ksqlDB?ksqlDB w Cybersecurity?2Problem3ŚrodowiskoApache Kafka + Zookeeper + ksqlDB4Packetbeat5ksqlDBGdzie strumyk płynie z wolnaPrzykładowy rekordStream ‘packetbeat’Strea...

Tagi: apache kafka, Big Data, kafka, ksql, ksqlDB, monitoring, Packetbeat, przetwarzanie strumieniowe, SQL, stream processing

Źródło: wiadrodanych.pl

Dziel się z innymi:

ksqlDB - magia SQL w czasie rzeczywistym - część 1 - Wiadro Danych

Bazy danych i XML 1296 dni, 20 godzin, 11 minut temu mszymczyk 52 źrodło rozwiń

1

Podbij ↑

Apache Kafka – Niezbędne podstawy teoretyczne

Czym właściwie jest Kafka i jakie są jej zastosowania? Zgodnie z definicją jest to platforma przeznaczona głównie do przetwarzania danych strumieniowo. Ciekawostką jest, że projekt zapoczątkowano w LinkedIn, a w późniejszym etapie stał się open-source’owy.

Tagi: Big Data, Broker, kafka

Źródło: pieceofdata.pl

Dziel się z innymi:

Apache Kafka – Niezbędne podstawy teoretyczne

Programowanie rozproszone 1373 dni, 20 godzin, 37 minut temu LukaszIdz 69 źrodło rozwiń

1

Podbij ↑

Czy potrzebujesz Big Data? – Piece of Data

Pierwszy wpis na blogu i zarazem mój debiut. Co prawda ten artykuł z .NET powiązany nie jest - ale nie wykluczam w przyszłości i takich z pogranicza .NET – Data ;) Każdy feedback będzie mile widziany.

Tagi: Big Data, Programowanie rozproszone

Źródło: pieceofdata.pl

Dziel się z innymi:

Czy potrzebujesz Big Data? – Piece of Data

Programowanie rozproszone 1542 dni, 21 godzin, 20 minut temu LukaszIdz 27 źrodło rozwiń

1

Podbij ↑

O analityce z Pawłem Potasińskim - Patoarchitekci

Tym razem rozmawiamy z Pawłem Potasińskim o analityce. Przewijają się różne zagadnienia - od klasycznych hurtowni po uczenie maszynowe, kompetencje zespołów data science, co powinni wiedzieć programiści na temat analityki i czego ludzi od danych mogą się nauczyć od programistów.

Tagi: analityka, Big Data, cloud, data warehouse, etl, Spark, SQL

Źródło: patoarchitekci.io

Dziel się z innymi:

O analityce z Pawłem Potasińskim - Patoarchitekci

Architektura 1576 dni, 20 godzin, 17 minut temu Łukasz Kałużny 33 źrodło rozwiń

1

Podbij ↑

Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych

Chcemy, aby nasze aplikacje w Apache Spark wykorzystywały wszystkie przydzielone zasoby. Niestety nie jest to takie proste. Rozproszenie obliczeń niesie za sobą koszty zarządzania zadaniami, a same zadania mają wobec siebie zależności. Z jednej strony ogranicza nas CPU (szybkość obliczeń), z drugiej strony dyski i sieć. MapReduce poświęciłem dedykowany materiał wideo. W artykule dowiesz się jak w 2 prostych krokach poprawić utylizację zasobów w Apache Spark.Spis treścihide1Prosta aplikacja2Nie taka prost...

Tagi: apache spark, Big Data, Distributed Processing, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych

Programowanie rozproszone 1576 dni, 20 godzin, 17 minut temu mszymczyk 14 źrodło rozwiń

1

Podbij ↑

Big Data - Jak zacząć? - Wiadro Danych

No właśnie. Jak zacząć w świecie Big Data? Przecież tyle tych technologii. Widać to choćby na tym schemacie. http://mattturck.com/wp-content/uploads/2019/07/2019MattTurckBigDataLandscapeFinal_Fullsize.png.Newsletter Amerykańscy naukowcy i radzieccy uczeni są zgodni w jednym: nie ma lepszego sposobu na początek przygody z Big Data, jak subskrypcja Wiadro Danych 😎 Przechodząc dalej, akceptujesz politykę prywatnościJęzyk Oczywiście najważniejszym językiem w IT jest… język angielski. Ale skończmy h...

Tagi: Big Data, docker, hdfs, hdinsight, Java, Python, Scala, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Inne 1876 dni, 21 godzin, 28 minut temu mszymczyk 46 źrodło rozwiń

1

Podbij ↑

Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych

Delta Lake zdobywa ostatnio coraz większa popularność. Słychać o nim na konferencjach na całym świecie. W tym artykule przyjrzymy się jakie problemy rozwiązuje.Spis treścihide1Co to Delta Lake?2Jupyter + Delta Lake3Przygotowanie danych4Bez Delta Lake5Z Delta LakeHistoria i podróże w czasieZarządzanie schematemVacuumDelta Lake APIDeleteUpdateMergeStreaming Sink6Co jest pod maską?7RepoCo to Delta Lake? Delta Lake to nakładka na Apache Spark. Pełni rolę warstwy persystencji i gwarantuje ACID na HDFS, S3, A...

Tagi: apache spark, Big Data, data lake, Delta, Delta Lake, hdfs, pyspark, Spark

Źródło: wiadrodanych.pl

Dziel się z innymi:

Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych

Bazy danych i XML 1968 dni, 20 godzin, 35 minut temu mszymczyk 52 źrodło rozwiń

1

Podbij ↑

Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data

Dzisiaj wstęp do usługi Data Lake Storage. Czyli ewolucja blob storage stworzona pod analizy narzędziami big data, ale nie tylko. Kilka słów o tym jak działa, pare demek i na koniec łączenie się z Databricks.

Tagi: Azure, Big Data, hadoop

Źródło: youtu.be

Dziel się z innymi:

Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data

Cloud 2028 dni, 21 godzin, 19 minut temu AdamMarczak 33 źrodło rozwiń

1

Podbij ↑

Problem małych plików w HDFS - Wiadro Danych

Korzystanie z HDFS bardzo przypomina korzystanie ze zwykłego systemu plików z użyciem terminala. Grupy, uprawnienia, pliki, foldery itp. Bawiąc się kolejnymi technologiami Big Data można zapomnieć się i potraktować HDFS jak zwykły dysk.Dane W ostanim wpisie wspomniałem kilkanaście źródeł danych. Na jednym z nich znalazłem Enron Email Dataset. Jest to zbiór maili przedsiębiorstwa energetycznego Enron. Co takiego charakteryzuje ten zbiór? Zawiera dużo małych plików.Jak dużo? Ściągnąłem, rozpakowałem i wy...

Tagi: Big Data, bigdata, hadoop, hdfs

Źródło: wiadrodanych.pl

Dziel się z innymi:

Problem małych plików w HDFS - Wiadro Danych

Bazy danych i XML 2050 dni, 20 godzin, 32 minuty temu mszymczyk 37 źrodło rozwiń

1

Podbij ↑

Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych

W poprzednim wpisie (Big Data to 3 słowa) wspomniałem z jakimi wyzwaniami mierzy się Big Data. Dotyczy to również architektury. Wykorzystywana wcześniej EDW (Enterprise Data Warehouse) nie pasuje do nowych standardów. Opracowano nową architekturę o bardzo obrazowej nazwie Data Lake (dosłownie Jezioro Danych). Wyobraź sobie te wszystkie górskie potoki (nazwa strumień danych nie wygląda na przypadkową), które spływają do jeziorka z którego wszyscy korzystają… ale najpierw przyjrzyjmy się co było nie tak w ...

Tagi: architecture, architektura, Big Data, data lake

Źródło: wiadrodanych.pl

Dziel się z innymi:

Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych

Architektura 2099 dni, 22 godziny, 7 minut temu mszymczyk 69 źrodło rozwiń

1

Podbij ↑

Big Data to 3 słowa - Wiadro Danych

Co to jest w ogóle Big Data? Słyszymy o systemach Big Data, technologiach Big Data, rozwiązaniach Big Data… a nawet o systemach klasy Big Data. Jest to trochę takie słowo wytrych, buzzword które nabrało popularności i się „sprzedaje”. Poniżej opisałem to co kryje się pod tym terminem według mnie. Termin Big Data najczęściej kojarzony jest z technologią Hadoop, czyli podejściem do rozproszonego przetwarzania danych wykorzystującego technikę MapReduce. Czy Hadoop to Big Data? Nie, nie tylko. Jak widać np....

Tagi: Big Data, hadoop

Źródło: wiadrodanych.pl

Dziel się z innymi:

Inne 2102 dni, 21 godzin, 29 minut temu mszymczyk 68 źrodło rozwiń

1

Podbij ↑

Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog

Ciężko czyta się grafy w postaci tekstowej. Znacznie lepsze jest do tego pismo pierwotne jakim są obrazki. Jeśli miałeś kiedyś problem z wizualizacją grafu w bibliotece GraphFrames na Apache Zeppelin to zapraszam do zerknięcia w kod.

Tagi: Big Data, Graf, graph, GraphFrames, Spark, Wizualizacja

Źródło: www.mszymczyk.com

Dziel się z innymi:

Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog

Bazy danych i XML 2239 dni, 21 godzin, 54 minuty temu mszymczyk 33 źrodło rozwiń

1

Podbij ↑

Data scientist – nowy zawód na nowe czasy

Kim jest data scientist? Co to za twór? Jakie języki programowania warto znać, aby pracować w świeżej gałęzi IT - czyli data science?

Tagi: Big Data, Data science, data scientist, Python, SQL

Źródło: www.dobreprogramy.pl

Dziel się z innymi:

Data scientist – nowy zawód na nowe czasy

Bazy danych i XML 2466 dni, 20 godzin, 43 minuty temu djfoxer 80 źrodło rozwiń

2

Podbij ↑

DevReview #3 O Big Data z Hubertem Chylikiem i Jackiem Byliną - Forever F[r]ame

Dzisiejszy odcinek jest dość nietypowy, ponieważ goszczę aż dwie osoby. A są to moi dobrzy znajomi z czasów studenckich: Huber Chylik oraz Jacek Bylina. Obaj programiści oraz miłośnicy dość świeżego „trendu” jakim jest Big Data. I to właśnie ten temat został poruszony w dzisiejszym odcinku Chłopaki powiedzieli co określa się mianem Big Data, jakie narzędzia i środowiska ułatwiają przetwarzanie i analizę dużych zbiorów danych oraz przedstawili kilka autorskich przykładów wykorzystania tej technologi, któ...

Tagi: Big Data, podcast

Źródło: foreverframe.pl

Dziel się z innymi:

DevReview #3 O Big Data z Hubertem Chylikiem i Jackiem Byliną - Forever F[r]ame

Inne 3303 dni, 20 godzin, 10 minut temu dpawlukiewicz 87 źrodło rozwiń

1

Podbij ↑

[EN] Using Hortonworks Hive in .NET

A first step into big data world.

Tagi: Big Data, C# .NET, Hive, Hortonworks

Źródło: dzapart.blogspot.ie

Dziel się z innymi:

Bazy danych i XML 3787 dni, 15 godzin, 56 minut temu dzapart 258 źrodło rozwiń

Big Data

ksqlDB - magia SQL w czasie rzeczywistym - część 1 - Wiadro Danych

Apache Kafka – Niezbędne podstawy teoretyczne

Czy potrzebujesz Big Data? – Piece of Data

O analityce z Pawłem Potasińskim - Patoarchitekci

Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych

Big Data - Jak zacząć? - Wiadro Danych

Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych

Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data

Problem małych plików w HDFS - Wiadro Danych

Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych

Big Data to 3 słowa - Wiadro Danych

Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog

Data scientist – nowy zawód na nowe czasy

DevReview #3 O Big Data z Hubertem Chylikiem i Jackiem Byliną - Forever F[r]ame

[EN] Using Hortonworks Hive in .NET

Polecamy

Nadchodzące wydarzenia

Tagi

Logowanie

lub...

lub...

Załóż konto

Zapomniałeś hasła

Edycja reklamy

Edycja wydarzenia