Pandas Series trong python là gì ? Pandas Series là dạng dữ liệu giống kiểu mảng một chiều hoặc giống như một cột trong bảng.
import pandas
dataset_languages = ['Python','C#','C++','PHP']
data = pandas.Series(dataset_languages)
print(data)
0 Python
1 C#
2 C++
3 PHP
dtype: object
Như các bạn có thể thấy các giá trị được gắn nhãn bởi các chỉ số index. Giá trị đầu tiên có index 0, giá trị thứ 2 có index 1...
Làm thế nào để lấy giá trị các phần tử trong Series ? Pandas cho phép lấy giá trị các phần tử bởi chỉ số index.Giá trị đầu tiên có index 0, giá trị thứ 2 có index 1...
Ví dụ lấy giá trị phần tử đầu tiên của Series như sau:
import pandas
dataset_languages = ['Python','C#','C++','PHP']
data = pandas.Series(dataset_languages)
First_Value = data[0]
print(First_Value)
Python
Bạn có thể sử dụng đối số index (index argument) để đặt tên cho các nhãn theo ý muốn của riêng mình.
Ví dụ tạo nhãn với các tên x,y,z,t và lấy giá trị bởi các phần tử bởi nhãn cho Series như sau:
import pandas
dataset_languages = ['Python','C#','C++','PHP']x Python
y C#
z C++
t PHP
dtype: object
PHP
Bạn cũng có thể sử dụng đối tượng Key/Value hoặc kiểu dữ liệu giống như dictionary để tạo Series. Với kiểu dữ liệu này thì các Key sẽ là nhãn. Để lấy một số phần tử trong dictionary bạn sử dụng đối số index và chỉ định chính xác các mục mà bạn muốn lấy.
Ví dụ tạo Pandas Series từ dictionary và chỉ lấy dữ liệu từ "Ngay1" và "Ngay2" như sau:
import pandas
Totals_Soluong = {"Ngay1": 500,"Ngay2": 600,"Ngay3": 800}Ngay1 500
Ngay2 600
dtype: int64
Series là giống như một cột của bảng. DataFrames là giống bảng. Do đó bạn có thể tạo DataFrames từ Series.
Ví dụ tạo DataFrames từ 2 Series như sau:
import pandas
data_series = { "Ngay1" :[500, 600, 800],"Soluong": [10, 20, 30]} Ngay1 Soluong
0 500 10
1 600 20
2 800 30