mi2-education / 2021z-datavisualizationtechniques Goto Github PK
View Code? Open in Web Editor NEW馃搳 Data Visualization Techniques course for DS studies in Winter 2020/21
馃搳 Data Visualization Techniques course for DS studies in Winter 2020/21
馃巹馃巹 Choinki to coroczna tradycja na Technikach Wizualizacji danych. 馃巹馃巹
馃巹馃巹馃巹馃巹馃巹馃巹馃巹
W ramach pracy domowej nale偶y wykona膰 choink臋 u偶ywaj膮c jednego z poni偶szych narz臋dzi:
Drzewka z poprzednich lat mo偶na obejrze膰 tutaj.
Inn膮 inspiracj膮 mog膮 by膰 matematyczne choinki.
馃巹馃巹馃巹馃巹馃巹馃巹馃巹
Prosz臋 o przes艂anie PD przez pull request, folder homework_9/imie_nazwisko
, powinien zawiera膰 kod choinki oraz wygenerowane drzewko w pdf, png, jpg, gif lub html je艣li choinka jest interaktywna.
Termin: zaj臋cia 21.12, ale je艣li kto艣 si臋 nie wyrobi, to drzewka b臋d臋 przyjmowa膰 do 3 stycznia.
Choinka warta jest 5 punkt贸w.
Prosz臋 o umieszczanie plik贸w projektu w folderze o nazwie nazwisko1_nazwisko2_nazwisko3
w folderze ./projects/project1
.
nazwisko1_nazwisko2_nazwisko3.pdf
nazwisko1_nazwisko2_nazwisko3.**
w formacie, kt贸ry 艂atwo otworzy膰Odpowiednio [projekt1] nazwisko1 plakat
i [projekt1] nazwisko1 nagranie
(Pull Request robi jedna osoba z zespo艂u)
[email protected]
(tytu艂 maila jak PR) np. gdyby nagranie nie mie艣ci艂o si臋 na giciep(t) = min(max((t - 125) * 馃槧 / 馃樁, 0) 1)
gdzie:
- t - d艂ugo艣膰 nagrania w sekundach
- 馃槧 - liczba zdenerwowanych tym faktem os贸b
- 馃樁 - liczba os贸b na wyk艂adzie
przy czym:
- liczb臋 potencjalnych punkt贸w do stracenia wybiera rzut kostk膮
- o utracie punkt贸w przes膮dzi wynik wywo艂ania wyra偶enia
rbinom(1, 1, p(t)) == 1
w j臋zyku R
zak艂adaj膮c, 偶e nie ustawia si臋 wcze艣niej ziarna losowo艣ci.
Opis i potrzebne pliki tu: https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/homeworks/homework_10/files
Kolejn膮 prac膮 domow膮 jest poprawa wykres贸w z Narodowego Spisu Powszechnego (NSP)
https://stat.gov.pl/spisy-powszechne/nsp-2011/nsp-2011-wyniki/
Nale偶y wybra膰 jeden wykres i poprawi膰 go.
Zadanie mozna wykonywa膰 w parach (wtedy nale偶y poprawi膰 2 wykresy).
Realizacja pracy domowej jest zaplanowana na zaj臋cia 2.11.2020.
Za przes艂anie wynik贸w do ko艅ca zaj臋膰 b臋dzie dodatkowy 1 pkt.
Prac臋 domow膮 nale偶y sk艂ada膰 przez PR, tak jak poprzednie.
W ramach pracy domowej prosz臋 o przygotowanie wizualizacji utworzonej z wykorzystaniem ggplot2.
Praca domowa powinna by膰 wykonana na podstawie wizualizacji dost臋pnej w prasie, telewizji lub internecie, opublikowanej w ci膮gu ostatnich 2 tygodni.
Minimalnie powinno to by膰 odtworzenie wizualizacji (3p), maksymalnie poprawa wizualizacji (5p).
Na przyk艂ad poprawa czytelno艣ci, s艂upki 2d zamiast 3d, poprawa s艂upk贸w, kt贸re nie zaczynaj膮 si臋 w 0, bardziej pasuj膮cy typ wykresu, ...
Prac臋 prosz臋 przes艂a膰 w postaci raportu rmd wyrenderowanego do pdf (preferowane), ewentualnie do html.
Prosz臋 o :
Najlepiej, gdyby wykresy 藕r贸d艂owe nie powtarza艂y si臋 w r贸偶nych pracach domowych. Z kolei wygenerowane wykresy nie mog膮 by膰 prawie identyczne, osobom kt贸re p贸藕niej zg艂osz膮 prac臋 domow膮 b臋d臋 obni偶a膰 punkty.
Prosz臋 o umieszczenie wszystkich plik贸w z prac膮 domow膮 w folderze nazwisko_imie
w
https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/homeworks/homework_2
Praca domowa powinna by膰 zg艂oszona przez Pull Request zawieraj膮cy imi臋, nazwisko oraz numer pracy domowej
Na kolejnych zaj臋ciach pierwsze 3 osoby z listy USOS b臋d膮 przedstawia膰 swoje prace domowe.
Termin: 18.10 (niedziela) do p贸艂nocy.
Prace przes艂ane po tym terminie b臋d膮 mie膰 minus jeden punkt za ka偶dy dzie艅 zw艂oki.
Utworzy膰 aplikacj臋 shiny na wz贸r tej:
https://agosiewska.shinyapps.io/World-app/
Dane mo偶na znale藕膰 w folderze https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/labs/data pod nazw膮 healthexp.Rds
.
Mo偶na je wczyta膰 komend膮 healthexp <- readRDS("healthexp.Rds")
Uwaga, shiny apps ma miesi臋czny limit 30h 艂膮cznego korzystania z aplikacji, wi臋c aplikacja mo偶e nie dzia艂a膰 je艣li zostanie przez nas wykorzystany.
Dlatego umieszczam te偶 zdj臋cia pogl膮dowe:
Prac膮 domow膮 numer 6 jest rozwi膮zanie zada艅 z notebooka:
https://github.com/mini-pw/2021Z-DataVisualizationTechniques/blob/master/homeworks/homework_6/homework_6.ipynb
Tak jak zawsze prosz臋 o wrzucenie jej poprzez pull request zawieraj膮cy imi臋, nazwisko oraz numer pracy domowej. Sam plik prosz臋 o umieszczenie w folderze nazwisko_imie
.
Termin: 22.11.2020.
Praca jest warta 5 pkt.
https://www.anaconda.com/blog/an-introduction-to-the-seaborn-objects-system
Modeled on grammar of graphics and closely aligned with ggplot2
Prace domowe 3 i 4 s膮 po艂膮czone, oznacza to 偶e obie zalicza si臋 wykonaniem jednego zadania a 艂膮cznie do zdobycia jest 10 pkt.
Plus ewentualne bonusy :)
T臋 prac臋 domow膮 mo偶na wykonywa膰 samodzielnie lub zespo艂owo (K os贸b, patrz opis ni偶ej) i na jej wykonanie s膮 2 tygodnie. Wszystkie osoby z zespo艂u otrzymuj膮 tyle samo punkt贸w.
Na wyk艂adzie omawiali艣my problemy z kodowaniem danych. Patrz: http://biecek.pl/Eseje/grafika/historia/2010MTurk.png
殴r贸d艂o: http://vis.stanford.edu/files/2010-MTurk-CHI.pdf
W ramach pracy domowej nale偶y przygotowa膰 K eksperyment贸w, sprawdzaj膮cych czy okre艣lone problemy z czytaniem danych wci膮偶 wyst臋puj膮 (problemy = iluzje na wykresach, b艂臋dy w odczytywaniu wykresu ko艂owego, b艂臋dy w pokazywaniu danych za pomoc膮 wykres贸w 3D, problemy z tytu艂ami na wykresie) (K = liczba os贸b w zespole, zesp贸艂 z 3 osobami powinien zrobi膰 3 eksperymenty).
Nast臋pnie nale偶y przetestowa膰 na przynajmniej 15 innych osobach czy dany problem wyst臋puje, np przeprowadzaj膮c ankiet臋 typu czy lepszy jest wykres A czy B.
Celem pracy jest sprawdzenie czy ,,dobre praktyki'' opracowane lata temu (s艂upki lepsze ni偶 k膮ty, kolor wykorzystywany z umiarem, unikanie ozdobnik贸w), faktycznie dzia艂a w spo艂ecze艅stwie kt贸re wykresami karmione jest od urodzenia.
Prosz臋 o umieszczenie raportu i ewentualnych dodatkowych plik贸w z prac膮 domow膮 w folderze zawieraj膮cym nazwiska cz艂onk贸w grupy w
https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/homeworks/homework_3
Praca domowa powinna by膰 zg艂oszona przez Pull Request zawieraj膮cy nazwiska autor贸w oraz numery pracy domowej
Na zaj臋ciach osoby z listy USOS o numerach 4-6 b臋d膮 przedstawia膰 prace domowe swoich grup.
Termin: 02.11 (niedziela) do p贸艂nocy.
Zadaniem jest poprawa pracy domowej numer 2 #60, kt贸ra polega艂a na poprawieniu wybranego przez siebie wykresu.
Macie ju偶 du偶o wi臋cej do艣wiadczenia w tworzeniu dobrych wizualizacji, zobaczmy, czy da si臋 poprawi膰 Wasze prace domowe :)
Co zrobi膰:
Wykorzysta膰 narz臋dzie do wizualizacji w Pythonie (matplotlib, seaborn) do poprawienia wykresu w ggplot2 zrobionego podczas PD2.
Najlepiej poprawi膰 swoj膮 prac臋 domow膮, ale mo偶na te偶 cudz膮.
Jak zrobi膰:
Wys艂a膰 jupyter notebook, ewentualnie pdf lub html. Wa偶ne, 偶eby by艂y w nim wszystkie wykresy oraz kod do wykresu w pythonie.
Powinien on zawiera膰:
oryginalny wykres (z internetu, telewizji, prasy, ...) wraz ze 藕r贸d艂em,
wykres w ggplot2 wraz z linkiem do pracy domowej w kt贸rej on si臋 pojawi艂, kod tego wykresu nie jest potrzebny,
poprawiony wykres z punktu nr 2 zrobiony w Pythonie,
Uzasadnienie, czemu wykres w Pythonie jest lepszy od dw贸ch poprzednich.
Jak wys艂a膰
Tak jak zawsze przez PR do folderu homework_7
, tam umie艣ci膰 folder ze swoim imieniem i nazwiskiem, a w nim pliki do pracy domowej.
Do kiedy
Termin: 29.11.2020
Maksymalnie mo偶na otrzyma膰 5 pkt.
Praca domowa rozgrzewkowa :)
Wykona膰 zadanie z biblioteki proton
.
Skrypt z rozwi膮zaniem umie艣ci膰 w folderze nazwisko_imie
znajduj膮cym si臋 w
https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/homeworks/homework_1
Rozwi膮zanie mo偶na umieszcza膰 poprzez pull request, prosz臋 w tytule poda膰 Nnazwisko, imi臋 oraz numer pracy domowej.
Termin: 11.10.2020 (niedziela) do p贸艂nocy
W ramach pracy domowej prosz臋 o przygotowanie wizualizacji utworzonej z wykorzystaniem matplotliba lub seaborna.
Praca domowa powinna by膰 wykonana na podstawie wizualizacji dost臋pnej w prasie, telewizji lub internecie, opublikowanej w ci膮gu ostatnich 2 tygodni.
Prac臋 prosz臋 przes艂a膰 w postaci Jupyter Notebooka.
Prosz臋 o :
podanie 藕r贸d艂a oraz zamieszczenie wizualizacji kt贸ra jest poprawiana,
umieszczenie kodu oraz utworzonej wizualizacji,
kr贸tkie uzasadnienie, dlaczego wykres jest lepszy ni偶 oryginalny.
Zale偶y mi w szczeg贸lno艣ci na istotnej poprawie i mniej wy艣wiechtanych przyk艂adach ni偶 wykres ko艂owy -> s艂upkowy.
Prosz臋 o umieszczenie wszystkich plik贸w z prac膮 domow膮 w folderze nazwisko_imie w
https://github.com/mini-pw/2021Z-DataVisualizationTechniques/tree/master/homeworks/homework_8
Praca domowa powinna by膰 zg艂oszona przez Pull Request zawieraj膮cy imi臋, nazwisko oraz numer pracy domowej
Termin: 7.12 (niedziela) do p贸艂nocy.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
馃枛 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 馃搳馃搱馃帀
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google 鉂わ笍 Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.