Jednym z podstawowych narzędzi Data Scientist jest Numpy. Niestety nadmiar danych może znacznie utrudnić nam zabawę. Dlatego powstało Koalas. Biblioteka umożliwiająca korzystanie z Apache Spark w taki sposób, jakbyśmy robili to za pomocą Numpy.Spis treścihide1Cel2Środowisko3Pip i Spark Session4Przygotowanie Spark DataFrame5Przygotowanie Koalas DataFrame6Top 10 najczęściej ocenianych filmówPySparkKoalas/PandasSpark SQL7Top 10 filmów wg średnich ocen (ale tylko takich, które mają >100 ocen)PySparkKoalas/Pa...
Strona głównaInne
Inne 1819 dni, 23 godziny, 21 minut temu 25 pokaż kod licznika zwiń
Podobne artykuły:
- Kto najlepiej ćwierka? Podstawy Graphframes + Tweepy - Wiadro Danych
- Delta Lake w Pigułce (czyli o podróżach w czasie) - Wiadro Danych
- Big Data - Jak zacząć? - Wiadro Danych
- Półtora miliarda haseł w Spark – część 2 – formaty danych - Wiadro Danych
- Jak zostać Ironmanem? Analiza CSV-ek w pandas - Wiadro Danych
- Półtora miliarda haseł w Spark – część 3 – partycjonowanie danych - Wiadro Danych
- [EN] Privilege escalation - Technical Blog - Future Processing — Technical Blog – Future Processing
- Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych
- Python w Data Science | Programistka Iwona
- Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog
- Skąd brać dane do projektów data science? Czyli webscraping. | Programistka Iwona