Pandas DataFrame trong python là gì? Pandas DataFrame là một kiểu có cấu trúc dữ liệu giống như một mảng array 2 chiều hoặc giống như một bảng table bao gồm các dòng (rows) và các cột (columns).
import pandas
data_series = { "Gia" :[500, 600, 800],"Soluong": [10, 20, 30]}
data = pandas.DataFrame(data_series)
print(data)
Gia Soluong
0 500 10
1 600 20
2 800 30
Thuộc tính loc trong DataFrame.
DataFrame trong pandas sử dụng thuộc tính loc để lấy giá trị một hoặc nhiều dòng (rows).
Ví dụ lấy 1 hàng đầu tiên bởi index 0 như sau:
import pandas
data_series = { "Gia" :[500, 600, 800],"Soluong": [10, 20, 30]}
df_data = pandas.DataFrame(data_series)
row0 = df_data.loc[0]
print(row0)
Gia 500
Soluong 10
Name: 0, dtype: int64
Kết quả ở ví dụ trên trả về là một Pandas Series.
Ví dụ lấy giá trị nhiều hàng rows bởi một danh sách các index như sau:
import pandas
data_series = { "Gia" :[500, 600, 800],"Soluong": [10, 20, 30]}
df_data = pandas.DataFrame(data_series)
rows_data = df_data.loc[[0,1,2]]
print(rows_data)
Gia Soluong
0 500 10
1 600 20
2 800 30
Kết quả trong ví dụ trên trả về là một Pandas DataFrame.
DataFrame cho phép bạn có thể đặt tên index theo ý muốn của riêng bạn.
import pandas
data = {'Gia': [500,600,900], 'Soluong': [5,10,15]}
df_data = pandas.DataFrame(data, index=['Ngay1','Ngay2','Ngay3'])
print(df_data.loc['Ngay3'])
Gia 900
Soluong 15
Name: Ngay3, dtype: int64
Pandas trong Python có các hàm đọc file exel, csv, xml, html... một cách đơn giản và dễ dàng.
Sau đây là cách load file hay đọc file CSV vào DataFrame trong Python.
import pandas
df_data = pandas.read_csv('data.csv')
print(df_data)