
R/Shiny Entwickler, Data Scientist und Statistik Berater
- Verfügbarkeit einsehen
- 1 Referenz
- 80€/Stunde
- München
- auf Anfrage
- de | en
- 12.10.2023
Kurzvorstellung
Auszug Referenzen (1)
"Alles sehr professionell abgewickelt, innerhalb des Budgets und Zeitrahmens."
10/2022 – 12/2022
Tätigkeitsbeschreibung
Entwicklung eines R-Pakets, das den Datendownload über verschiedene API-Schnittstellen und die anschließende Datenaufbereitung automatisiert. Aufbauend auf den bereinigten Daten werden Grafiken und weitere automatisierte Analysen in eine Powerpoint Präsentation geladen und abgespeichert.
Verwendete R Pakete: httr, dplyr, ggplot2, rmarkdown, officer, devtools
Data Mining, Data Science, Datenanalyse, R (Programmiersprache)
Qualifikationen
Projekt‐ & Berufserfahrung
10/2022 – 12/2022
Tätigkeitsbeschreibung
Entwicklung eines R-Pakets, das den Datendownload über verschiedene API-Schnittstellen und die anschließende Datenaufbereitung automatisiert. Aufbauend auf den bereinigten Daten werden Grafiken und weitere automatisierte Analysen in eine Powerpoint Präsentation geladen und abgespeichert.
Verwendete R Pakete: httr, dplyr, ggplot2, rmarkdown, officer, devtools
Data Mining, Data Science, Datenanalyse, R (Programmiersprache)
Ausbildung
Technische Universität Dortmund
Universität Passau
Über mich
Ich arbeite seit mittlerweile 5 Jahren mit R. Begonnen habe ich mit überwiegend explorativer Datenanalyse und Supervised Learningproblemen. Während dieser Zeit habe ich umfangreiche Erfahrungen mit dem Tidyverse (inkl. data.table), funktioneller und objekt-orientierter Programmierung in R, Visualisierung (ggplot2, plotly), Reporting (LaTeX, rmarkdown, knitr), Webscraping (rvest) und interaktiven Webapps (shiny, bs4Dash) gesammelt. Meine erste (sehr einfache) shiny App können Sie hier finden: corona.statup.solutions/ . Diese shiny App soll ein Gefühl für die Infektionsdynamik während der Corona Pandemie vermitteln und veranschaulichen welchen Einfluss die Teststrategie auf die Inzidenz hat. Diese shiny App ist Teil eines online-Kurses des KI-Campus. Darüber hinaus lege ich großen Wert darauf, dass mein Code jederzeit reproduzierbar (Versionierung mit Git) und umfangreich kommentiert ist (roxygen2). Ich befolge den tidyverse Styleguide und lege großen Wert auf "defensive proramming" und programmiere daher alle meine Funktionen nach dem Motto "fail early and often" mit Hilfe des checkmate Pakets.
Ich habe bereits einige statistische Reports mit rmarkdown & knitr verfasst und auch shiny Apps inklusive ansprechendem Frontend (bs4Dash) programmiert. Außerdem habe ich umfassende Erfahrungen mit Geodaten; insbesondere mit deren Abfrage (osmdata), Aufbereitung (sf) und Visualisierung (leaflet). Zudem habe ich ein R-Paket programmiert, welche die Durchführung von Monte Carlo Simulationen sowie die Auswertung und Darstellung der Ergebnisse so einfach wie möglich gestalten soll (zu finden auf meinem GitHub Account: [...]). Darüber hinaus implementiere ich derzeit einen Boosting-Algorithmus in einem eigenen R-Paket (dieses ist allerdings noch nicht öffentlich verfügbar).
Auf freelancermap finden Sie noch ausführlichere Informationen zu meinen aktuellen und vergangenen Projekten: [...]
Weitere Kenntnisse
R, Git, LaTeX, SQL, Python, Jira, CI/CD, Docker
R Programmierung/Pakete:
- Paket Programmierung (devtools, usethis, roxygen2)
- interaktive Webapplikationen (shiny, bs4Dash, golem, bslib)
- Maschinelles Lernen, Deep Learning (mlr3, tidymodels, caret, tensorflow, vetiver)
- Datenaufbereitung (dplyr, data.table, magrittr, stringr, purrr, lubridate)
- Datenvisualisierung (ggplot2, plotly, ggiraph)
- Unit Tests/Assertions (checkmate, testthat, shinytest2)
- Reporting (rmarkdown, knitr, officer)
- Geodaten (osmdata, leaflet, sf)
- Webscraping (rvest)
- API-Abfragen (httr, httr2)
- Parallel Computing (future, furrr)
- API-Entwicklung (plumber)
- Data Processing/Analysis pipelines (targets)
statistische/machinelearning Modelle:
Allgemeine lineare Modelle, gemischte Modelle, LASSO, Quantilsregression,
Zeitreihenmodellierung, Discriminant Analysis,
Entscheidungsbäume / Random Forests, Bagging, Modelbased & treebased Boosting,
Bootstrapping,
Multilayer Neuralnetworks, Convolutional Neural Network, Recurrent Neural Networks
Clusteranalyse, Hauptkomponentenanalyse,
Monte-Carlo-Simulationen
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden