tiepvupsu / ebookml_src Goto Github PK
View Code? Open in Web Editor NEWSource code in ebook Machine Learning
Source code in ebook Machine Learning
Chào anh Tiệp, em là người đọc sách của anh, trong quá trình đọc em đã phát hiện ra một số lỗi, topic này chỉ để đóng góp chứ không có ý gì khác, cảm ơn anh đã mang đến cho cộng đồng một cuốn sách rất hay và chất lượng.
Hiện em đang đọc cuốn sách, các vấn đề sẽ được em cập nhật liên tục trong quá trình nghiên cứu
Hi anh Tiệp,
Em đang đọc đến phần thuật toán k-means trong cuốn sách Machine learning cơ bản
, và có một số thắc mắc.
means = [[2, 2], [8, 3], [3, 6]]
cov = [[1, 0], [0, 1]]
N = 500
X0 = np.random.multivariate_normal(means[0], cov, N)
X1 = np.random.multivariate_normal(means[1], cov, N)
X2 = np.random.multivariate_normal(means[2], cov, N)
X = np.concatenate((X0, X1, X2), axis = 0)
K = 3
Em đang hiểu đoạn code trên là tạo ra một tập dữ liệu X là mảng hai chiều có cấu trúc như sau:
[[x00, x01],
[x10, x11],
[x20, x21],
[x30, x31],
...
[xn0, xn1]]
trong đó, [xi0, xi1]
với i >= 0 && i < n
là feature của một phần tử trong tập dữ liệu X. Em hiểu như vậy có chính xác không?
Nếu đúng thì nghĩa là trong tập dữ liệu X ta đang xét đến việc clustering cho tập dữ liệu dựa trên 2 feature là xi0
và xi1
có đúng không?
Với các bài toán clustering dựa trên 1 feature
hoặc 3 feature
thì ta sẽ xử lý như thế nào? Thay đổi kích cỡ của mảng hay nên xử lý bằng cách nào khác?
Em xin cảm ơn!
Dòng đầu tiên: "Các bài toan phân lớp..."
Dưới công thức 15.1: Mối quan hệ này, với mỗi ai phụ thuộc vào tất cả các zi, thõa mãn...
Hi a Tiệp, @tiepvupsu
Em tổng hợp lại 1 số lỗi chính tả như sau, các lỗi sẽ được tiếp tục update.
cùng => cũng
được cho => được vẽ
deeep learning => deep learning
scikit-learng => scikit-learn
nhưng thư viện => những thư viện
bản quyển => bản quyền
nếu rõ tên => nêu rõ tên
dầu phẩy => dấu phẩy
=> không (bỏ dấu gạch trên)
Bẵng => Bằng
tập huấn luyên => tập huấn luyện
có điều kiên => có điều kiện
xảy ra đồng thời xảy ra => đồng thời xảy ra
machine learing => machine learning
dữ liệu vào X => dữ liệu đầu vào X
Vì dụ => Ví dụ
xunh quanh => xung quanh
đề tìm tòi => để tìm tòi
thằng tất cả => thắng tất cả
mô mô hình => mô hình
Điều này là cần thiết các phép toán => Điều này là cần thiết do các phép toán
dử liệu => dữ liệu
Có hai khối có nền màu lục cần được thiết kế:
Khối thứ nhất, Feature Extraction,
=> Phần này đang liệt kê rõ ra 2 khối cần được thiết kế, tuy nhiên khối thứ 2 không được nhắc đến rõ ràng, chỉ được nêu qua qua ở mục cuối của phần 6.2.1
, do đó nếu độc giả đọc lướt qua, thì ko biết được khối thứ 2 đóng vai trò gì. Em nghĩ nên có 1 phần giải thích về khối thứ 2 này.
extracted features => extracted feature (để phù hợp với extracted feature ở dòng trên)
nhờ và việc các hai khối phía trên => nhờ vào việc hai khối phía trên
vector x1 ban đầu => vector x0 ban đầu
trình bay => trình bày
phẩn tử => phần tử
từ điền => từ điển
lục => xanh lục (cho phù hợp với danh sách màu ở trên)
say mạc => sa mạc
hai patches => hai patch
classe => class
bài toàn => bài toán
nên nên => nên
tính trunh bình => tính trung bình
một => 1 (nên dùng số cho thống nhất do ở bên trên có viết x0 =1)
một môt hình => một mô hình
đai lượng => đại lượng
thường đường => thường được
validation set set => validation set
Lỗi chính tả trang vii - mục 0.10
"đều thuộc bản quyển của tôi"
Lỗi font bookmarks.
em đã nhận được mail của anh về tải sách,nhưng em vào trang https://fundaml.com/ebook nhưng nó tự chuyển hướng về trang https://fundaml.com/dashboard và không thấy nút tải sách.mail của em là:[email protected] cũng đã dùng mail này đăng ký trên web https://fundaml.com/dashboard rồi
Trang 184: "Đầu ra của sofmax network..."
Trang 186: "...vì nó là một vector ở dang one-het..."
"...Biểu thức này đạt giá trị ??? nhất nếu qc = 1..."
Trang 193: "...với các bài toán OR, AND, và OR..."
Trang 197: Hình 16.4, node cuối cùng của l_th layer, thiếu các chỉ số của z
Trang 215: "... Nhóm thứ hai, collaborative filtering, sẽ được thảo luận trong các chương còn lại của chương." (theo em nên để là "các chương còn lại của phần"
)
Trang 217: dòng đầu tiên: "được sản phẩm tới ngừời dùng..."
Trang 218 dòng cuối: "...đã được rated bởi ngừoi dùng thứ n..."
"...(ở đây là số sao đã rate) của ngừoi dùng thứ n..."
(Em thấy lỗi này khá nhiều nhưng cũng chỉ lưu lại nhiêu đây :D)
Trang 219: "...sao cho mức độ quan tâm của một user tới một người dùng..." (user quan tâm item ạ :D)
Hôm nay em mới đọc đến đây. Hẹn a ngày mai ạ :D
trang 41: Hai biến ngẫu nhiên x và ycó thể
--> chữ y và có bị dính liền nhau
trang 142: (x2, it2) = myGD1(5, 1)
--> với cùng learning rate η = 0.1, vì sao là myGD1(5,1) mà không là myGD1(5, .1) ???
Trang 143
Trang 186
Cái nữa là khi mình photo ebook thì số trang nằm ở mép trong khá khó tra cứu, một số ảnh minh họa không phân biệt được ( do in trắng đen )
1/ Trong ebook này, phần 7.2.4 chỗ công thức nghiệm w (7.11) mình thấy đang khác với trên trang web. Phần code ví dụ bên dưới Tiệp cũng đang làm theo công thức trên web chứ không phải công thức này.
2/ Đoạn ký hiệu x ngang = [x0,x1,...xN] và w ngang = [w0,...wN] theo mình nên chọn ký tự khác N để tránh nhầm lẫn với số điểm dữ liệu?
x^Tw_i nên là x_i^Tw
trong (7.5) sau dấu bằng đầu tiên cần có bình phương.
Mình chạy thử code thuật toán PCA để nhận diện khuôn mặt, nhưng đến dòng
X[:, cnt] = misc.imread(fn).reshape(D)
thì báo lỗi do thư viện Scipy từ phiên bản 1.0.0 đã remove method misc.imread(). Trên trang Scipy có đề nghị dùng thư viện imageio.imread() để thay thế, nhưng thư viện này lại không có hàm reshape() nên mình chưa biết làm thế nào
import numpy as np
from scipy import misc
np.random.seed(1)
path = '/home/nhonnt/Documents/vicohub_lab/PCA/YALE/faces/'
ids = range(1, 16)
states = ['centerlight', 'glasses', 'happy', 'leftlight', 'noglasses', 'normal', 'rightlight', 'sad', 'sleepy', 'surprised', 'wink']
prefix = 'subject'
surfix = '.pgm'
h, w, K = 116, 98, 100 # hight, weight, new dim
D = h * w
N = len(states)*15
X = np.zeros((D, N))
cnt = 0
for person_id in range(1, 16):
for state in states:
fn = path + prefix + str(person_id).zfill(2) + '.' + state + surfix
print(fn)
X[:, cnt] = misc.imread(fn).reshape(D)
cnt += 1
from sklearn.decomposition import PCA
pca = PCA(n_components=K)
pca.fit(X.T)
U = pca.components_.T
Sách:
0 = x1a1 + x1a2 + · · · + xnan (1.15)
Nên:
0 = x1a1 + x2a2 + · · · + xnan (1.15)
Hình hơi nặng nên load không được trơn tru
Em đã thử trên mọi trình duyệt Opera, Edge, Chrome, Vivaldi, Firefox và thử Refresh như anh nói nhưng vẫn không thấy nút tải sách. Anh Tiệp có thể xử lý giúp em được không ạ?
def myGD1(x0, eta:
Thiếu đóng ngoặc :D
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.