tiepvupsu / ebookml_src Goto Github PK

View Code? Open in Web Editor NEW

158.0 158.0 132.0 101.14 MB

Source code in ebook Machine Learning

Python 0.83% Jupyter Notebook 99.12% Shell 0.02% Perl 0.02% Dockerfile 0.01%

ebookml_src's People

Contributors

Stargazers

Watchers

Forkers

truong225 hatung manhhado hunglvosu hvdthong zuzoovn daovantoan lamhoangtung gandalfvn doanvanthien pavetw17 ga-tungnguyen anhlbt andreale28 nguyenchithien trinhdinhphuong khuongquynhlong minatu2d tonyle9 kentray dtn97 afcarl hqcthunders ledihdug tnganh0027 truongkhanhduy95 nganltp guentoan hnq90 thanhtam94hust dvhieu ducnguyen77 trtuancs nguyenviettien13 diengiau hongbuithanh vietwear dnhdang94 ping203 vis10n phutoan31299 banv nguyenhaitrieu10 duongnamhaui estevaofv thang291 namnh97 alexlevn hhc2tech nguyentrihai93 baoson202 nghilamphuc qndev nguyenngoclinhchi khanhct nguyenbaopc mrsinguyen cobaohieu tranchuyen282 fantasy2210 kienbc danhtrancong thoaiho97 charliedinh quoccuonglqd tiendht vodinhnam nguyen-cao phvanhoang vuviethung1998 ndq3004 longhuynh thanhtung48c anhvn phan2410 ducvoqn dinhson2905 huyng14 imroytran ddiem-ri-4d gstearmit d3v3l0 frigiddragon tnhdong michael-pham duydthiph viethung-chv dongphuongman hintran0208 gin-trungson nqvuong99qn gemmanguen vmintam andyle0302 miracle30 ngnclht1102 anh-ta-2020 quocchanh1999 kekhokhao hercules261188

ebookml_src's Issues

Danh sách các lỗi đánh máy

Chào anh Tiệp, em là người đọc sách của anh, trong quá trình đọc em đã phát hiện ra một số lỗi, topic này chỉ để đóng góp chứ không có ý gì khác, cảm ơn anh đã mang đến cho cộng đồng một cuốn sách rất hay và chất lượng.

Hiện em đang đọc cuốn sách, các vấn đề sẽ được em cập nhật liên tục trong quá trình nghiên cứu

Trang 40, định nghĩa 1.1, thiếu kí tự M
Trang 48, mục 2.4.6, công thức 2.15 bị sai, đúng ra phải là aji * xij chứ không phải aji * xji
Trang 48, mục 2.4.7, trong dấu nabla phải là b chứ không phải b^T

number section and text are too close (after chaper 9) in Table of Contents.

Thắc mắc về input trong thuật toán k-means

Hi anh Tiệp,

Em đang đọc đến phần thuật toán k-means trong cuốn sách Machine learning cơ bản, và có một số thắc mắc.

means = [[2,  2], [8,  3], [3,  6]]
cov = [[1, 0], [0,  1]]
N = 500
X0 = np.random.multivariate_normal(means[0], cov, N)
X1 = np.random.multivariate_normal(means[1], cov, N)
X2 = np.random.multivariate_normal(means[2], cov, N)
X = np.concatenate((X0, X1, X2), axis = 0)
K = 3

Em đang hiểu đoạn code trên là tạo ra một tập dữ liệu X là mảng hai chiều có cấu trúc như sau:

[[x00, x01],
[x10, x11],
[x20, x21],
[x30, x31],
...
[xn0, xn1]]

trong đó, [xi0, xi1] với i >= 0 && i < n là feature của một phần tử trong tập dữ liệu X. Em hiểu như vậy có chính xác không?

Nếu đúng thì nghĩa là trong tập dữ liệu X ta đang xét đến việc clustering cho tập dữ liệu dựa trên 2 feature là xi0 và xi1 có đúng không?

Với các bài toán clustering dựa trên 1 feature hoặc 3 feature thì ta sẽ xử lý như thế nào? Thay đổi kích cỡ của mảng hay nên xử lý bằng cách nào khác?

Em xin cảm ơn!

Lỗi chính tả trang 180

Dòng đầu tiên: "Các bài toan phân lớp..."

Lỗi chính tả trang 181

Dưới công thức 15.1: Mối quan hệ này, với mỗi ai phụ thuộc vào tất cả các zi, thõa mãn...

Tổng hợp các lỗi sai chính tả

Hi a Tiệp, @tiepvupsu

Em tổng hợp lại 1 số lỗi chính tả như sau, các lỗi sẽ được tiếp tục update.

Trang 2

cùng => cũng

Trang 3

được cho => được vẽ

Trang 4

deeep learning => deep learning

scikit-learng => scikit-learn

nhưng thư viện => những thư viện

Trang 7

bản quyển => bản quyền

nếu rõ tên => nêu rõ tên

Trang 12

dầu phẩy => dấu phẩy

Trang 15

=> không (bỏ dấu gạch trên)

Trang 36

Bẵng => Bằng

Trang 52

tập huấn luyên => tập huấn luyện

Trang 53

có điều kiên => có điều kiện

xảy ra đồng thời xảy ra => đồng thời xảy ra

Trang 64

machine learing => machine learning

Trang 68

dữ liệu vào X => dữ liệu đầu vào X

Vì dụ => Ví dụ
xunh quanh => xung quanh

Trang 69

đề tìm tòi => để tìm tòi
thằng tất cả => thắng tất cả

Trang 70

mô mô hình => mô hình

Trang 71

Điều này là cần thiết các phép toán => Điều này là cần thiết do các phép toán

Trang 72

dử liệu => dữ liệu

Có hai khối có nền màu lục cần được thiết kế:
Khối thứ nhất, Feature Extraction,

=> Phần này đang liệt kê rõ ra 2 khối cần được thiết kế, tuy nhiên khối thứ 2 không được nhắc đến rõ ràng, chỉ được nêu qua qua ở mục cuối của phần 6.2.1, do đó nếu độc giả đọc lướt qua, thì ko biết được khối thứ 2 đóng vai trò gì. Em nghĩ nên có 1 phần giải thích về khối thứ 2 này.

Trang 74

extracted features => extracted feature (để phù hợp với extracted feature ở dòng trên)

nhờ và việc các hai khối phía trên => nhờ vào việc hai khối phía trên

Trang 75

vector x1 ban đầu => vector x0 ban đầu

trình bay => trình bày

Trang 76

phẩn tử => phần tử
từ điền => từ điển

Trang 77

lục => xanh lục (cho phù hợp với danh sách màu ở trên)

say mạc => sa mạc

Trang 78

hai patches => hai patch

Trang 80

classe => class

bài toàn => bài toán

Trang 81

nên nên => nên

Trang 85

tính trunh bình => tính trung bình

Trang 86

một => 1 (nên dùng số cho thống nhất do ở bên trên có viết x0 =1)

Trang 91

một môt hình => một mô hình

Trang 94

đai lượng => đại lượng

Trang 95

thường đường => thường được

Trang 96

validation set set => validation set

Lỗi chính tả trang vii - mục 0.10

Lỗi chính tả trang vii - mục 0.10
"đều thuộc bản quyển của tôi"

Lỗi indentation trong các đoạn code

Lỗi font bookmark

Lỗi font bookmarks.

Không thấy nút tải sách

em đã nhận được mail của anh về tải sách,nhưng em vào trang https://fundaml.com/ebook nhưng nó tự chuyển hướng về trang https://fundaml.com/dashboard và không thấy nút tải sách.mail của em là:[email protected] cũng đã dùng mail này đăng ký trên web https://fundaml.com/dashboard rồi

Tổng hợp 7/1

Trang 184: "Đầu ra của sofmax network..."
Trang 186: "...vì nó là một vector ở dang one-het..."
"...Biểu thức này đạt giá trị ??? nhất nếu qc = 1..."
Trang 193: "...với các bài toán OR, AND, và OR..."
Trang 197: Hình 16.4, node cuối cùng của l_th layer, thiếu các chỉ số của z
Trang 215: "... Nhóm thứ hai, collaborative filtering, sẽ được thảo luận trong các chương còn lại của chương." (theo em nên để là "các chương còn lại của phần"
)
Trang 217: dòng đầu tiên: "được sản phẩm tới ngừời dùng..."
Trang 218 dòng cuối: "...đã được rated bởi ngừoi dùng thứ n..."
"...(ở đây là số sao đã rate) của ngừoi dùng thứ n..."
(Em thấy lỗi này khá nhiều nhưng cũng chỉ lưu lại nhiêu đây :D)
Trang 219: "...sao cho mức độ quan tâm của một user tới một người dùng..." (user quan tâm item ạ :D)
Hôm nay em mới đọc đến đây. Hẹn a ngày mai ạ :D

Gradient descent

trang 41: Hai biến ngẫu nhiên x và ycó thể
--> chữ y và có bị dính liền nhau

trang 142: (x2, it2) = myGD1(5, 1)
--> với cùng learning rate η = 0.1, vì sao là myGD1(5,1) mà không là myGD1(5, .1) ???

Trang 143, 186

Trang 143

Hình 12.2 tương ứng với x 0 = −5
Trong Hình 12.3 tương ứng với x 0 = 5

Trang 186

Biểu thức này đạt giá trị nhất nếu q c = 1
một vector ở dang one-het

Cái nữa là khi mình photo ebook thì số trang nằm ở mép trong khá khó tra cứu, một số ảnh minh họa không phân biệt được ( do in trắng đen )

1

1/ Trong ebook này, phần 7.2.4 chỗ công thức nghiệm w (7.11) mình thấy đang khác với trên trang web. Phần code ví dụ bên dưới Tiệp cũng đang làm theo công thức trên web chứ không phải công thức này.
2/ Đoạn ký hiệu x ngang = [x0,x1,...xN] và w ngang = [w0,...wN] theo mình nên chọn ký tự khác N để tránh nhầm lẫn với số điểm dữ liệu?

Lỗi phương trình (7.3) và (7.5)

x^Tw_i nên là x_i^Tw

trong (7.5) sau dấu bằng đầu tiên cần có bình phương.

1.2 Chuyển vị và Hermitian

Chỗ này em nghĩ [x1 x2 .... x m] là [x1 x2 .... x n]

Lỗi thư viện scipy trong thuật toán PCA (chương 21) do đã bỏ imread()

Mình chạy thử code thuật toán PCA để nhận diện khuôn mặt, nhưng đến dòng
X[:, cnt] = misc.imread(fn).reshape(D)
thì báo lỗi do thư viện Scipy từ phiên bản 1.0.0 đã remove method misc.imread(). Trên trang Scipy có đề nghị dùng thư viện imageio.imread() để thay thế, nhưng thư viện này lại không có hàm reshape() nên mình chưa biết làm thế nào

import numpy as np
from scipy import misc
np.random.seed(1)

path = '/home/nhonnt/Documents/vicohub_lab/PCA/YALE/faces/'
ids = range(1, 16)
states = ['centerlight', 'glasses', 'happy', 'leftlight', 'noglasses', 'normal', 'rightlight', 'sad', 'sleepy', 'surprised', 'wink']
prefix = 'subject'
surfix = '.pgm'

h, w, K = 116, 98, 100 # hight, weight, new dim
D = h * w
N = len(states)*15

X = np.zeros((D, N))
cnt = 0
for person_id in range(1, 16):
    for state in states:
        fn = path + prefix + str(person_id).zfill(2) + '.' + state + surfix
        print(fn)
        X[:, cnt] = misc.imread(fn).reshape(D)
        cnt += 1

from sklearn.decomposition import PCA
pca = PCA(n_components=K)
pca.fit(X.T)

U = pca.components_.T