Pandas Series

Pandas Series trong python là gì ? Pandas Series là dạng dữ liệu giống kiểu mảng một chiều hoặc giống như một cột trong bảng.

Cách tạo Pandas Series.

Ví dụ

import pandas

dataset_languages = ['Python','C#','C++','PHP']
data = pandas.Series(dataset_languages)
print(data)

Kết quả :

0    Python
1        C#
2       C++
3       PHP
dtype: object

Như các bạn có thể thấy các giá trị được gắn nhãn bởi các chỉ số index. Giá trị đầu tiên có index 0, giá trị thứ 2 có index 1...

Cách lấy giá trị các phần tử của Series trong Pandas.

Làm thế nào để lấy giá trị các phần tử trong Series ? Pandas cho phép lấy giá trị các phần tử bởi chỉ số index.Giá trị đầu tiên có index 0, giá trị thứ 2 có index 1...

Ví dụ lấy giá trị phần tử đầu tiên của Series như sau:

Ví dụ

import pandas

dataset_languages = ['Python','C#','C++','PHP']
data = pandas.Series(dataset_languages)

First_Value = data[0]
print(First_Value)

Kết quả :

Python

Bạn có thể sử dụng đối số index (index argument) để đặt tên cho các nhãn theo ý muốn của riêng mình.

Ví dụ tạo nhãn với các tên x,y,z,t và lấy giá trị bởi các phần tử bởi nhãn cho Series như sau:

Ví dụ

import pandas

dataset_languages = ['Python','C#','C++','PHP']
data = pandas.Series(dataset_languages, index=['x','y','z','t'])
print(data)
First_Value = data['t'];
print(First_Value)

Kết quả :

x    Python
y        C#
z       C++
t       PHP
dtype: object
PHP

Cách tạo Pandas Series từ Dictionary.

Bạn cũng có thể sử dụng đối tượng Key/Value hoặc kiểu dữ liệu giống như dictionary để tạo Series. Với kiểu dữ liệu này thì các Key sẽ là nhãn. Để lấy một số phần tử trong dictionary bạn sử dụng đối số index và chỉ định chính xác các mục mà bạn muốn lấy.

Ví dụ tạo Pandas Series từ dictionary và chỉ lấy dữ liệu từ "Ngay1" và "Ngay2" như sau:

Ví dụ

import pandas

Totals_Soluong = {"Ngay1": 500,"Ngay2": 600,"Ngay3": 800}
data = pandas.Series(Totals_Soluong, index=["Ngay1","Ngay2"])
print(data)

Kết quả :

Ngay1    500
Ngay2    600
dtype: int64

Cách tạo DataFrames từ các Series.

Series là giống như một cột của bảng. DataFrames là giống bảng. Do đó bạn có thể tạo DataFrames từ Series.

Ví dụ tạo DataFrames từ 2 Series như sau:

Ví dụ

import pandas

data_series = { "Ngay1" :[500, 600, 800],"Soluong": [10, 20, 30]}
data = pandas.DataFrame(data_series)
print(data)

Kết quả :

   Ngay1  Soluong
0    500       10
1    600       20
2    800       30