Analyzing Big Data with Microsoft R

Academy
Digicomp
Kurzbeschreibung
Sie lernen in diesem Kurs, Microsoft R Server zu verwenden, um eine Analyse auf einem grossen Dataset zu erstellen und auszuführen. Ausserde... mehr...
Sie lernen in diesem Kurs, Microsoft R Server zu verwenden, um eine Analyse auf einem grossen Dataset zu erstellen und auszuführen. Ausserdem wird gezeigt, wie Sie diese in Big-Data-Umgebungen wie einem Hadoop- oder Spark-Cluster verwenden. weniger
Kursorte
Basel, Bern, Zürich
Kursarten
Kurs/Seminar
Fachbereiche

Informatik, Microsoft Professional, Data Science, Microsoft Datenbanken

Dieser Kurs ist neu hier. 0 User folgen diesem Kurs und erhalten Bescheid, wenn es Neues gibt - Kurs jetzt folgen.

Du hast den Kurs besucht? Kurs jetzt bewerten.

Hier kannst du der Eggheads Community deine Fragen zu diesem Kurs stellen. Auch Kursleiter können mitdiskutieren.


Frage stellen

Du must angemeldet sein um zu antworten

Kursleiter

Andi

Andi Profilfoto
Kursinhalt
  1. Module: Microsoft R Server and R Client - Explain how Microsoft R Server and Microsoft R Client work.
    • Lessons:
      • What is Microsoft R server
      • Using Microsoft R client
      • The ScaleR functions
    • Lab: Exploring Microsoft R Server and Microsoft R Client
      • Using R client in VSTR and RStudio
      • Exploring ScaleR functions
      • Connecting to a remote server
  2. Module: Exploring Big Data - At the end of this module the student will be able to use R Client with R Server to explore big data held in different data stores.
    • Lessons:
      • Understanding ScaleR data sources
      • Reading data into an XDF object
      • Summarizing data in an XDF object
    • Lab: Exploring Big Data
      • Reading a local CSV file into an XDF file
      • Transforming data on input
      • Reading data from SQL Server into an XDF file
      • Generating summaries over the XDF data
  3. Module: Visualizing Big Data - Explain how to visualize data by using graphs and plots.
    • Lessons:
      • Visualizing In-memory data
      • Visualizing big data
    • Lab: Visualizing data
      • Using ggplot to create a faceted plot with overlays
      • Using rxlinePlot and rxHistogram
  4. Module: Processing Big Data - Explain how to transform and clean big data sets.
    • Lessons:
      • Transforming Big Data
      • Managing datasets
    • Lab: Processing big data
      • Transforming big data
      • Sorting and merging big data
      • Connecting to a remote server
  5. Module: Parallelizing Analysis Operations - Explain how to implement options for splitting analysis jobs into parallel tasks.
    • Lessons:
      • Using the RxLocalParallel compute context with rxExec
      • Using the revoPemaR package
    • Lab: Using rxExec and RevoPemaR to parallelize operations
      • Using rxExec to maximize resource use
      • Creating and using a PEMA class
  6. Module: Creating and Evaluating Regression Models - Explain how to build and evaluate regression models generated from big data.
    • Lessons:
      • Clustering Big Data
      • Generating regression models and making predictions
    • Lab: Creating a linear regression model
      • Creating a cluster
      • Creating a regression model
      • Generate data for making predictions
      • Use the models to make predictions and compare the results
  7. Module: Creating and Evaluating Partitioning Models - Explain how to create and score partitioning models generated from big data.
    • Lessons:
      • Creating partitioning models based on decision trees.
      • Test partitioning models by making and comparing predictions
    • Lab: Creating and evaluating partitioning models
      • Splitting the dataset
      • Building models
      • Running predictions and testing the results
      • Comparing results
  8. Module: Processing Big Data in SQL Server and Hadoop - Explain how to transform and clean big data sets.
    • Lessons:
      • Using R in SQL Server
      • Using Hadoop Map/Reduce
      • Using Hadoop Spark
    • Lab: Processing big data in SQL Server and Hadoop
      • Creating a model and predicting outcomes in SQL Server
      • Performing an analysis and plotting the results using Hadoop Map/Reduce
      • Integrating a sparklyr script into a ScaleR workflow
Kursziele
  • Wissen, wie Microsoft R Server und Microsoft R Client funktionieren
  • Verwenden von R Client mit R Server, um grosse Daten in verschiedenen Datenspeichern zu erkunden
  • Visualisieren von Daten mit Hilfe von Graphen und Plots
  • Umwandeln und Bereinigen grosser Datensätze
  • Implementieren von Optionen für die Aufteilung von Analyseaufträgen in parallelen Aufgaben
  • Verfahren zur Auswertung von Regressionsmodellen aus grossen Daten
  • Erstellen eines Regressionsmodells
  • Erstellen und Bewerten von Partitionierungsmodellen, die aus grossen Daten generiert wurden
  • Verwenden von R in SQL-Server- und Hadoop-Umgebungen
Zielpublikum

Primär angesprochen sind Personen, die grosse Datensätze in einer grossen Datenumgebung analysieren möchten. Auch angesprochen sind Entwickler, die R-Analysen in ihre Lösungen integrieren müssen.

Anforderungen
Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen, Kenntnis der gemeinsamen statistischen Methoden und Datenanalyse Best Practices, Grundkenntnisse des Microsoft-Windows-Betriebssystems und dessen Kernfunktionalitäten sowie Kenntnisse der relationalen Datenbanken
Kursgebühr
Fr. 2'600.00
Nächste Durchführungsdaten
  • 8. August 2018
  • 31. Oktober 2018