Git Product home page Git Product logo

ebookml_src's People

Contributors

hatung avatar tiepvupsu avatar zuzoovn avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

ebookml_src's Issues

Danh sách các lỗi đánh máy

Chào anh Tiệp, em là người đọc sách của anh, trong quá trình đọc em đã phát hiện ra một số lỗi, topic này chỉ để đóng góp chứ không có ý gì khác, cảm ơn anh đã mang đến cho cộng đồng một cuốn sách rất hay và chất lượng.

Hiện em đang đọc cuốn sách, các vấn đề sẽ được em cập nhật liên tục trong quá trình nghiên cứu

  1. Trang 40, định nghĩa 1.1, thiếu kí tự M
  2. Trang 48, mục 2.4.6, công thức 2.15 bị sai, đúng ra phải là aji * xij chứ không phải aji * xji
  3. Trang 48, mục 2.4.7, trong dấu nabla phải là b chứ không phải b^T

Thắc mắc về input trong thuật toán k-means

Hi anh Tiệp,

Em đang đọc đến phần thuật toán k-means trong cuốn sách Machine learning cơ bản, và có một số thắc mắc.

means = [[2,  2], [8,  3], [3,  6]]
cov = [[1, 0], [0,  1]]
N = 500
X0 = np.random.multivariate_normal(means[0], cov, N)
X1 = np.random.multivariate_normal(means[1], cov, N)
X2 = np.random.multivariate_normal(means[2], cov, N)
X = np.concatenate((X0, X1, X2), axis = 0)
K = 3

Em đang hiểu đoạn code trên là tạo ra một tập dữ liệu X là mảng hai chiều có cấu trúc như sau:

[[x00, x01],
[x10, x11],
[x20, x21],
[x30, x31],
...
[xn0, xn1]]

trong đó, [xi0, xi1] với i >= 0 && i < n là feature của một phần tử trong tập dữ liệu X. Em hiểu như vậy có chính xác không?

Nếu đúng thì nghĩa là trong tập dữ liệu X ta đang xét đến việc clustering cho tập dữ liệu dựa trên 2 feature là xi0xi1 có đúng không?

Với các bài toán clustering dựa trên 1 feature hoặc 3 feature thì ta sẽ xử lý như thế nào? Thay đổi kích cỡ của mảng hay nên xử lý bằng cách nào khác?

Em xin cảm ơn!

Lỗi chính tả trang 181

Dưới công thức 15.1: Mối quan hệ này, với mỗi ai phụ thuộc vào tất cả các zi, thõa mãn...

Tổng hợp các lỗi sai chính tả

Hi a Tiệp, @tiepvupsu

Em tổng hợp lại 1 số lỗi chính tả như sau, các lỗi sẽ được tiếp tục update.


  • Trang 2

screen shot 2018-01-19 at 4 00 24 pm

cùng => cũng


  • Trang 3

screen shot 2018-01-19 at 4 05 14 pm

được cho => được vẽ


  • Trang 4

screen shot 2018-01-19 at 4 05 54 pm

deeep learning => deep learning

screen shot 2018-01-19 at 4 06 48 pm

scikit-learng => scikit-learn

screen shot 2018-01-19 at 4 07 32 pm

nhưng thư viện => những thư viện


  • Trang 7

screen shot 2018-01-19 at 4 08 30 pm

bản quyển => bản quyền

screen shot 2018-01-19 at 4 09 14 pm

nếu rõ tên => nêu rõ tên


  • Trang 12

screen shot 2018-01-19 at 4 10 05 pm

dầu phẩy => dấu phẩy


  • Trang 15

screen shot 2018-01-19 at 4 53 55 pm

=> không (bỏ dấu gạch trên)


  • Trang 36

screen shot 2018-01-19 at 5 04 30 pm

Bẵng => Bằng


  • Trang 52

screen shot 2018-01-19 at 4 10 54 pm

tập huấn luyên => tập huấn luyện


  • Trang 53

screen shot 2018-01-19 at 4 11 52 pm

có điều kiên => có điều kiện

screen shot 2018-01-19 at 4 12 15 pm

xảy ra đồng thời xảy ra => đồng thời xảy ra


  • Trang 64

screen shot 2018-01-19 at 4 13 21 pm

machine learing => machine learning


  • Trang 68

screen shot 2018-01-19 at 4 14 31 pm

dữ liệu vào X => dữ liệu đầu vào X

screen shot 2018-01-19 at 4 15 23 pm

Vì dụ => Ví dụ
xunh quanh => xung quanh


  • Trang 69

screen shot 2018-01-19 at 4 17 20 pm

đề tìm tòi => để tìm tòi
thằng tất cả => thắng tất cả


  • Trang 70

screen shot 2018-01-19 at 4 18 30 pm

mô mô hình => mô hình

  • Trang 71

screen shot 2018-01-19 at 4 19 04 pm

Điều này là cần thiết các phép toán => Điều này là cần thiết do các phép toán


  • Trang 72

screen shot 2018-01-19 at 4 20 06 pm

dử liệu => dữ liệu

Có hai khối có nền màu lục cần được thiết kế:
Khối thứ nhất, Feature Extraction,

=> Phần này đang liệt kê rõ ra 2 khối cần được thiết kế, tuy nhiên khối thứ 2 không được nhắc đến rõ ràng, chỉ được nêu qua qua ở mục cuối của phần 6.2.1, do đó nếu độc giả đọc lướt qua, thì ko biết được khối thứ 2 đóng vai trò gì. Em nghĩ nên có 1 phần giải thích về khối thứ 2 này.


  • Trang 74

screen shot 2018-01-19 at 4 20 53 pm

extracted features => extracted feature (để phù hợp với extracted feature ở dòng trên)

screen shot 2018-01-19 at 4 22 23 pm

nhờ và việc các hai khối phía trên => nhờ vào việc hai khối phía trên


  • Trang 75

screen shot 2018-01-19 at 4 31 54 pm

vector x1 ban đầu => vector x0 ban đầu

screen shot 2018-01-19 at 4 32 46 pm

trình bay => trình bày


  • Trang 76

screen shot 2018-01-19 at 4 33 27 pm

phẩn tử => phần tử
từ điền => từ điển


  • Trang 77

screen shot 2018-01-19 at 4 34 22 pm

lục => xanh lục (cho phù hợp với danh sách màu ở trên)

screen shot 2018-01-19 at 4 35 24 pm

say mạc => sa mạc


  • Trang 78

screen shot 2018-01-19 at 4 35 58 pm

hai patches => hai patch


  • Trang 80

screen shot 2018-01-19 at 4 36 49 pm

classe => class

screen shot 2018-01-19 at 4 37 24 pm

bài toàn => bài toán


  • Trang 81

screen shot 2018-01-19 at 4 39 38 pm

nên nên => nên


  • Trang 85

screen shot 2018-01-19 at 4 40 23 pm

tính trunh bình => tính trung bình


  • Trang 86

screen shot 2018-01-19 at 4 40 59 pm

một => 1 (nên dùng số cho thống nhất do ở bên trên có viết x0 =1)


  • Trang 91

screen shot 2018-01-19 at 4 42 30 pm

một môt hình => một mô hình


  • Trang 94

screen shot 2018-01-19 at 4 43 15 pm

đai lượng => đại lượng


  • Trang 95

screen shot 2018-01-19 at 4 43 48 pm

thường đường => thường được


  • Trang 96

screen shot 2018-01-19 at 4 44 28 pm

validation set set => validation set

Tổng hợp 7/1

Trang 184: "Đầu ra của sofmax network..."
Trang 186: "...vì nó là một vector ở dang one-het..."
"...Biểu thức này đạt giá trị ??? nhất nếu qc = 1..."
Trang 193: "...với các bài toán OR, AND, và OR..."
Trang 197: Hình 16.4, node cuối cùng của l_th layer, thiếu các chỉ số của z
Trang 215: "... Nhóm thứ hai, collaborative filtering, sẽ được thảo luận trong các chương còn lại của chương." (theo em nên để là "các chương còn lại của phần"
)
Trang 217: dòng đầu tiên: "được sản phẩm tới ngừời dùng..."
Trang 218 dòng cuối: "...đã được rated bởi ngừoi dùng thứ n..."
"...(ở đây là số sao đã rate) của ngừoi dùng thứ n..."
(Em thấy lỗi này khá nhiều nhưng cũng chỉ lưu lại nhiêu đây :D)
Trang 219: "...sao cho mức độ quan tâm của một user tới một người dùng..." (user quan tâm item ạ :D)
Hôm nay em mới đọc đến đây. Hẹn a ngày mai ạ :D

Gradient descent

trang 41: Hai biến ngẫu nhiên x và ycó thể
--> chữ y và có bị dính liền nhau

trang 142: (x2, it2) = myGD1(5, 1)
--> với cùng learning rate η = 0.1, vì sao là myGD1(5,1) mà không là myGD1(5, .1) ???

Trang 143, 186

Trang 143

  • Hình 12.2 tương ứng với x 0 = −5
  • Trong Hình 12.3 tương ứng với x 0 = 5

Trang 186

  • Biểu thức này đạt giá trị nhất nếu q c = 1
  • một vector ở dang one-het

Cái nữa là khi mình photo ebook thì số trang nằm ở mép trong khá khó tra cứu, một số ảnh minh họa không phân biệt được ( do in trắng đen )

1

1/ Trong ebook này, phần 7.2.4 chỗ công thức nghiệm w (7.11) mình thấy đang khác với trên trang web. Phần code ví dụ bên dưới Tiệp cũng đang làm theo công thức trên web chứ không phải công thức này.
2/ Đoạn ký hiệu x ngang = [x0,x1,...xN] và w ngang = [w0,...wN] theo mình nên chọn ký tự khác N để tránh nhầm lẫn với số điểm dữ liệu?

Lỗi thư viện scipy trong thuật toán PCA (chương 21) do đã bỏ imread()

Mình chạy thử code thuật toán PCA để nhận diện khuôn mặt, nhưng đến dòng
X[:, cnt] = misc.imread(fn).reshape(D)
thì báo lỗi do thư viện Scipy từ phiên bản 1.0.0 đã remove method misc.imread(). Trên trang Scipy có đề nghị dùng thư viện imageio.imread() để thay thế, nhưng thư viện này lại không có hàm reshape() nên mình chưa biết làm thế nào

import numpy as np
from scipy import misc
np.random.seed(1)

path = '/home/nhonnt/Documents/vicohub_lab/PCA/YALE/faces/'
ids = range(1, 16)
states = ['centerlight', 'glasses', 'happy', 'leftlight', 'noglasses', 'normal', 'rightlight', 'sad', 'sleepy', 'surprised', 'wink']
prefix = 'subject'
surfix = '.pgm'

h, w, K = 116, 98, 100 # hight, weight, new dim
D = h * w
N = len(states)*15

X = np.zeros((D, N))
cnt = 0
for person_id in range(1, 16):
    for state in states:
        fn = path + prefix + str(person_id).zfill(2) + '.' + state + surfix
        print(fn)
        X[:, cnt] = misc.imread(fn).reshape(D)
        cnt += 1

from sklearn.decomposition import PCA
pca = PCA(n_components=K)
pca.fit(X.T)

U = pca.components_.T

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.