centrum promocji informatyki
E-MAIL
zapisz się zapisz się zapisz się wypisz się
O NASSZKOLENIAMEDIA O NASPARTNERZYREGULAMINKONTAKT

szkolenie
ANALIZA DANYCH W SYSTEMIE R DLA NAUKOWCÓW
Warszawa, 05.10.2017 Koordynator: Iwona Nowosielska

Użycie darmowych narzędzi w nauce i analityce ważny trend, widoczny od lat. Obecnie już nawet jest trudno uniknąć ich używania. Darmowy do wszelkich zastosowań system statystyczny R stosowany jest powszechnie i wypiera rozwiązania komercyjne. Jest językiem programowania wyposażonym w tysiące bibliotek zawierających funkcje do analizy danych i modelowania. Wokół R powstał też cały ekosystem narzędzi analitycznych. Jeden z twórców poprzednika R, języka S, John Chambers otrzymał nagrodę Software System Award ASA z komentarzem: “S has forever altered the way people analyze, visualize, and manipulate data”. W ostatnich latach R stał się standardowym narzędziem współczesnej statystyki stosowanej. Używany jest praktycznie wszędzie: instytucjach naukowych i publicznych oraz w firmach z najróżniejszych branż. Warto dobrze znać R.
Nauczymy się, jak pracować z R i z jakich pakietów korzystać. Rozpoczniemy od wczytywania danych, przejdziemy przez ich obróbkę, skończymy na wizualizacji wyników i ich zapisywaniu. Zajmiemy się też wygodnym tworzeniem powtarzalnych analiz i raportów -- bardzo ważnym dla naukowców.

Sposób prowadzenia
Szkolenie prowadzone głównie w formie ćwiczeń wykonywanych przez uczestników. Prezentacje stanowią niewielką część szkolenia. Zajęcia odbywać się będą przy użyciu komputerów. Uczestnik może przyjechać ze swoim komputerem z zainstalowaną najnowszą wersją R i RStudio lub skorzystać z stanowiska komputerowego przygotowanego przez organizatora.

Przygotowanie do szkolenia
Jakiekolwiek doświadczenie w pracy z danymi, w dowolnym narzędziu.

Grupa szkoleniowa max. 15 osób.

Prowadzący:
dr inż. Artur Suchwałko, Data Scientist, właściciel firmy QuantUp.pl Artur ma dwudziestoletnie doświadczenie w projektach analitycznych. Pracował dla różnych firm, od start-upów po międzynarodowe korporacje i w różnych rolach, od pracownika, przez konsultanta, po właściciela. Jest doświadczonym programistą oraz menedżerem projektów. Przez kilkanaście lat pracy statystyka w banku zajmował się głównie budową modeli predykcyjnych i tworzeniem oprogramowania do ich budowy. W tym samym czasie został doktorem matematyki i napisał kilkanaście prac naukowych. Od sześciu lat rozwija z sukcesem swoją firmę QuantUp (www.quantup.pl), zajmującą się usprawnianiem procesów w firmach z wykorzystaniem modelowania statystycznego i tworzeniem oprogramowania oraz szkoleniami z tych dziedzin. Przeprowadził przynajmniej kilkadziesiąt projektów i kilka tysięcy godzin komercyjnych szkoleń z głębszej analityki biznesowej. Jest współwłaścicielem, Vice CEO i CSO szwedzkiej firmy bioinformatycznej MedicWave. Od kilkunastu lat wykorzystuje w biznesie darmowe oprogramowanie (głównie R) i promuje jego używanie, także podczas wielu konferencji biznesowych. Jest fanem R i współautorem wydanej w PWN książki o prognozowaniu w R.
Więcej informacji o Arturze:

  • Profil LinkedIn: www.linkedin.com/in/artursuchwalko
  • Strona firmy QuantUp: www.quantup.pl/

Program szkolenia (od 10:00 do 17:00)

  1. Wstęp:
    • Wprowadzenie do R.
    • Praca z RStudio.
    • Wyszukiwania i instalacja pakietów.
    • Szukanie pomocy.
  2. Typy i struktury danych:
    • Typy zmiennych.
    • Obiekty i ich podstawowe własności (wektory, zmienne tekstowe, listy i ramki danych).
    • Podstawowe operacje na obiektach (w tym wektoryzacja).
    • Operacje na tekście w (stringr).
    • Data i czas w R oraz operacje na nich (lubridate).
    • Praca na wynikach procedur statystycznych.
  3. Input / output:
    • Wczytywanie danych wejściowych w kilku popularnych formatach (pliki tekstowe, bazy danych, komunikacja z Excelem).
    • Eksportowanie danych wyjściowych do innych systemów analitycznych, w kilku popularnych formatach.
  4. Praca z danymi (data wrangling):
    • pakiet dplyr (filtrowanie, sortowanie, grupowanie itp.),
    • pakiet reshape2 (zmiana postaci danych).
  5. Grafika:
    • pakiet ggplot2 (koncepcja, przegląd elementów wykresów i rodzajów wykresów).
  6. Elementy programowania w R:
    • Instrukcje sterujące przepływem kodu.
    • Tworzenie własnych skryptów i funkcji.
  7. Podstawy powtarzalnych analiz i raportów:
    • Tworzenie skryptów.
    • Raporty w R Markdown.

Program
Prelegenci
Informacje organizacyjne
Formularz zgłoszeniowy
Powiadom znajomego
  
e-mailkontakt Na górę strony
Copyright © 2002 Centrum Promocji Informatyki Sp. z o.o. | ul. Miedzyborska 50 | tel. (0-22) 870 69 10, 870 69 78