Machine Learning-Thuật toán Median

Thuật toán Median là gì?

Thuật toán Median (Median Algorithm) là một thuật toán được dùng để tính số trung vị của một dãy số.

Số trung vị Median là số ở vị trí trung tâm, chính giữa của mội dãy số đã được sắp xếp theo thứ tự tăng dần hoặc giảm dần.

 

Cách tính số trung vị Median.

Nếu số phần tử của dãy số là lẻ thì số trung vị Median là số ở chính giữa của dãy số.

Ví dụ: Số trung vị của 1,2,3,6,8,11,156

Nếu số phần tử của dãy số là chẵn thì số trung vị Median được tính bằng trung bình cộng của 2 phần tử chính giữa.

Ví dụ: Số trung vị của 1,2,3,6,8,11,15,18 là (6+8)/2 = 7

 

Cách tính số trung vị Median sử dụng phương thức median() của thư viện Numpy trong python.

Ví dụ: Chúng ta sẽ tìm hiểu về bài toán tìm học sinh có điểm môn Tiếng Anh xếp ở vị trí chính giữa của 15 sinh viên. Giả sử điểm môn tiếng anh của 15 sinh viên được thống kê với danh sách dữ liệu như sau:

points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]

Ví dụ

import numpy as np

# Danh sách điểm môn tiếng anh của 15 sinh viên:
points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]


# Thuật toán tìm số trung vị trong Machine Learning sử dụng phương thức median().
number_Median = np.median(points_English)
print('So trung vi Median la: ', number_Median)

Kết quả :

So trung vi Median la: 83.0