Git Product home page Git Product logo

tokupon_ds's Introduction

データ分析入門

このリポジトリは徳島大学デザイン型AI教育研究センターが実施する とくぽんAI塾のコース「データ分析入門」のための資料置き場です。

Binder

binderによる演習環境を提供しています。 上記のボタンをクリックすることでbinder上のRStduio Serverが起動します。 (起動に時間がかかることがあります) これによりブラウザ上でRを動かすことができます。 必要なデータ、パッケージはすでにインストールされている状態です。 資料のqmdファイルを開き、内容を試してみてください。

スライド

当日投影したスライドの公開版をSpeaker Deckで公開しています。

https://speakerdeck.com/s_uryu/tokupon-ds2022

スライドへのリンク

ライセンス

MIT

とくぽん(徳島大学マスコットキャラクター)の著作権は徳島大学に帰属します。

tokupon_ds's People

Contributors

dependabot[bot] avatar uribo avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

tokupon_ds's Issues

参考文献の表記

各章末尾の参考文献や全体での参考文献のページで表記がおかしなものがあるのでちゃんとする。

image
image

誤記(まとめのページ)

先にまとめのページを見て気づいた誤記についてご連絡します。

tokupon_ds/summary.qmd

Lines 10 to 11 in 22df027

[統計グラフ全国コンクール](https://www.sinfonica.or.jp/tokei/graph/index.html)は1953年から開催されている統計グラフの作成によるコンクルールです。過去の受賞作品を閲覧できるため、優れた統計グラフの例も知ることができます。
なお全国コンクルールは各都道府県で実施されるコンクールの優秀作品が評価対象となります。

コンクルール→コンクール(L10, L11にそれぞれ一箇所、計二箇所)

[統計データ分析コンペティション](https://www.nstac.go.jp/statcompe/)は、高校生、大学生等を対象としたデータ分析コンペティションの一つです。[SSDSE(教育用標準データセット)](https://www.nstac.go.jp/use/literacy/ssdse/)などを用いた統計データ分析内容をを論文として提出することになっています。統計データに対するアイデアと解析力が競われます。

分析内容をを→分析内容を


以下は誤記ではないが気になった点です

- なるほど統計学園 https://www.stat.go.jp/naruhodo/index.html

URLがリンクになっていないですが良いですか?

- http://phylopic.org/image/eedde61f-3402-4f7c-9350-49b74f5e1dba ([Public Domain Mark 1.0](https://creativecommons.org/publicdomain/mark/1.0/))

これ以降もURLはリンクになっていませんが良いですか?

3.1 の誤記等

引き続き読んでおります。段々と内容が高度になってきた…!
2章は特に誤記等はみつからなかったと思います。以下、3.1で気づいた点です。

各グループ区切りの値となる点をそれぞれ第1四分位点(25パーセンタイル))、第2四分位点(50パーセンタイル)、第3四分位点(75パーセンタイル)と呼びます。

(25パーセンタイル))
)が不要

データの半分が含まれる第1四分位点から第3四分位数までの範囲のことを四分位範囲と呼びます。

第3四分位数
→ 第3四分位点

これについては後ほど、[度数分布表](#データの分布)を紹介するときに説明します。

の、

度数分布表

のリンク先が存在しないのか、正しく移動しないようです。

誤記など(1.1まで)

素晴らしい資料の公開、ありがとうございます。私も微力ながら貢献できればと思い、いくつか見つけた誤記と思われる箇所ついて下記のとおり報告いたします。
いずれも元のドキュメントの方を指してしますが、分かりづらければ次回からドキュメント側を指します。

この内容が分かりにくかった、読めないが漢字があったときには

読めないが漢字→読めない漢字

データと触れている、といってもデータは実態がなく、認識しづらいものです。

実態→実体

この方法について、コースの中でも[第2章](summary_statistics.qmd)[第4章](visualization.qmd)で扱います。

2章と4章となっていますが、リンク先のドキュメントのインデックスは3と5になっています(章番号は拾えないのでしたっけ…)


以下は誤記というよりは気になった点です。

@fig-penguins を見ると、**翼の長さが大きい個体ほど口ばしの長さも大きい**と言えるような気がします。

「大きい」より「長い」の方が日本語として自然?(グラフの説明をするときは大きいと言う気もしますね。自信なし)

geom_point(aes(color = species)) +

図1.2の凡例はspeciesになっていますが、ペンギンの種類のような日本語には特にしないで良いですか?(コードが煩雑になるのでしていない?)

#### ジョン・スノウによる2つの地図

こちらは後に図が入るのかなと思いますが、抜けると良くないので上げておきます。

1章(1.2以降)の誤記

1.2章は特にみつからなかったです。

## データ分析で扱う問題

1.3の文章は書きかけですかね?ぶつ切りになっているので(修正予定だったらすみません)


以下は気になったけど修正するべきかは?な点です。

## 参考文献・URL

参考文献ですが、書籍については()で囲われていますが、これは意図的でしょうか?デフォルトの表示がこの形ですかね?

あと、1章の演習問題の解答を見ていて、

tokupon_ds/exercise.qmd

Lines 14 to 19 in 0511808

```{r}
#| include: false
set.seed(12)
x <-
sort(round(rnorm(n = 40, mean = 48, sd = 16), digits = 0))
x[32:40] <- x[32:40] + rpois(n = 9, lambda = 10)

のコードが表示がないので、

のxがどこから出てきたんだろう?となりそうと思いました(最初見たとき、どう作っているのだろう?と私も思いました…)
問題の解説的にはデータの作り方自体はあまり重要ではないので、コード自体は載せなくても良いかもですが(考えすぎですかね…)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.