Korzystanie z HDFS bardzo przypomina korzystanie ze zwykłego systemu plików z użyciem terminala. Grupy, uprawnienia, pliki, foldery itp. Bawiąc się kolejnymi technologiami Big Data można zapomnieć się i potraktować HDFS jak zwykły dysk.Dane W ostanim wpisie wspomniałem kilkanaście źródeł danych. Na jednym z nich znalazłem Enron Email Dataset. Jest to zbiór maili przedsiębiorstwa energetycznego Enron. Co takiego charakteryzuje ten zbiór? Zawiera dużo małych plików.Jak dużo? Ściągnąłem, rozpakowałem i wy...
Strona głównaBazy danych i XML
Bazy danych i XML 2054 dni, 17 godzin, 55 minut temu 37 pokaż kod licznika zwiń
Podobne artykuły:
- Azure Data Lake Storage (Gen 2) | Najlepsza usługa do składowania plików dla technologii big data
- O analityce z Pawłem Potasińskim - Patoarchitekci
- DevReview #3 O Big Data z Hubertem Chylikiem i Jackiem Byliną - Forever F[r]ame
- Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych
- Big Data - Jak zacząć? - Wiadro Danych
- Po co rozpraszać storage? Krótko o HDFS.
- Data scientist – nowy zawód na nowe czasy
- Półtora miliarda haseł w Spark - część 1 - czyszczenie - Wiadro Danych
- Czy potrzebujesz Big Data? – Piece of Data
- Big Data to 3 słowa - Wiadro Danych
- Jak działa MapReduce?