Machine Learning - Thuật toán Percentiles

Percentiles trong Machine Learning là gì ?

Percentiles là thuật toán tính phần trăm.Trong Machine Learning thuật toán này được sử dụng rất phổ biến.

Thuật toán tính phầm trăm Percentiles được sử dụng trong thống kê, nó là một số mô tả giá trị phần trăm nhất định của các giá trị thấp hơn.

 

Cách tính phần trăm trong Machine Learning.

Ví dụ 1: Chúng ta có điểm môn tiếng Anh của 15 sinh viên. Cái gì là chiếm 75 phần trăm (percentile) ? 75 phần trăm là những điểm nào?

Để tính phần trăm này, sử dụng phương thức percentile() trong Numpy python để tìm phần trăm.

Giả sử chúng ta có danh sách điểm tiếng anh của 15 sinh viên như sau:

points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]

Tìm điểm của sinh viên chiếm 75%.

Ví dụ

import numpy as np

# Danh sách điểm môn tiếng anh của 15 sinh viên:
points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]

# Tìm điểm của sinh viên chiếm 75%.

percentile_Diem = np.percentile(points_English,75)
print(" Diem chiem 75% la: ",percentile_Diem)

Kết quả :

Diem chiem 75% la:  90.5

Kết quả điểm chiểm 75% là 90.5. Có nghĩa là 75% sinh viên có điểm dưới 90.5.

Ví dụ 2: Giả sử chúng ta có danh sách dân số tuổi như sau:

People_ages = [10,15,20,5,35,100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]

Độ tuổi chiếm 90% là độ tuổi nào?

Để giải quyết bài toán này bạn sử dụng phương thức percentile() trong Numpy để xác định độ tuổi chiếm 90%.

Ví dụ

import numpy as np

# Danh dách tuổi:
People_ages = [10,15,20,5,35,100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]

# Tìm độ tuổi chiếm 90%.

age_phantram = np.percentile(People_ages,90)

print("Do tuoi chiem 90% la: ",age_phantram)

Kết quả :

Do tuoi chiem 90% la:  96.3

Kết quả độ tuổi chiếm 90% là 96.3. Có nghĩa là 90% dân số có tuổi dưới 96.3.