Để giải quyết các bài toán trong lập trình machine learning bạn cần phải biết về các thuật toán trong toán học và biết cách sử dụng vận dụng các thuật toán đó để đào tạo cho máy móc, thiết bị.
Có rất nhiều thuật toán trong Machine learning như : Mean, Median, Mode, Standard Deviation, Percentiles, Data Distribution, Normal Data Distribution, Linear Regression, Polynomial Regression, Multiple Regression, Regression, Classification, Instance-based, Regularization, Bayesian, Clustering, Artificial Neural Network, Dimensionality Reduction, Ensemble... Tuy nhiên ở bài này chúng tôi sẽ giới thiệu về thuật toán cơ bản nhất, đơn giản nhất đó là thuật toán Mean, với mục đích để bạn hiểu và hình dung được cách sử dụng thuật toán trong toán học để giải quyết bài toán về machine learning.
1. Thuật toán Mean là gì?
2. Cách tính giá trị trung bình trong toán học.
3. Cách tính giá trị trung bình bằng phương thức Mean trong machine leaning sử dụng Python.
4. Ứng dụng của thuật toán Mean
Thuật toán Mean (Mean Algorithm) là một thuật toán được dùng để tính giá trị trung bình.
Ví dụ: Chúng ta sẽ tìm hiểu về bài toán tính điểm trung bình môn Tiếng Anh và tìm điểm xuất hiện nhiều nhất của 15 sinh viên. Giả sử điểm môn tiếng anh của 15 sinh viên được thống kê với danh sách dữ liệu như sau:
points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]
Trong toán học để tính giá trị trung bình bạn cần phải tìm tổng của tất cả giá trị và sau đó chia cho số của các giá trị.
Ví dụ tính điểm trung bình môn Tiếng Anh của 15 sinh viên chúng ta cần phải tính tổng điểm môn tiếng anh của 15 sinh viên đó sau đó chia cho 15.
(100+99+82+87+81+82+96+87+94+78+71+85+82+83+82) / 15 = 85.93333333333334
Diem trung binh mon Tieng Anh la: 85.93333333333334
Bằng cách sử dụng thuận toán trong toán học ở trên bạn tính được giá trị trung bình điểm của 15 học sinh là 85.93333333333334. Đó là cách tính toán thông thường trong toán học, vậy trong Machine learning, làm thế nào để tính giá trị trung bình?
Trong machine learning bạn có thể sử dụng phương thức mean() trong thư viện Numpy của Python để tìm giá trị trung bình một cách đơn giản và dễ dàng.
Ví dụ tính giá trị trung bình sử dụng phương thức mean() trong thư viện Numpy như sau:
import numpy as np
# Danh sách điểm môn tiếng anh của 15 sinh viên:
points_English = [100,99,82,87,81,82,96,87,94,78,71,85,82,83,82]
# Tính giá trị trung bình sử dụng phương thức Mean trong Numpy
average_point_English= np.mean(points_English)
print("Diem trung binh mon Tieng Anh la:", average_point_English)
Diem trung binh mon Tieng Anh la: 85.93333333333334
Thuật toán Mean thường sử dụng trong lập trình Machine Learning, vì vậy bạn cần nắm chắc và hiểu rõ khái niệm này để phát triển cho các ứng dụng về machine learning sau này.