Search…

Trích Xuất Dữ Liệu từ File Excel bằng Python - Phần 1: Đọc Dữ Liệu

29/09/20202 min read
Hướng dẫn cách để trích xuất dữ liệu từ file excel bằng python.

Hướng dẫn cách để trích xuất dữ liệu từ file excel bằng python.

Hiện thực

Cài đặt gói xlrd

Truy cập https://pypi.org/project/xlrd/#files để tải gói xlrd:

Sau khi tải về, giải nén và truy cập đến thư mục và chạy cmd:

Cửa sổ cmd hiện lên gõ vào dòng lệnh sau để tiến hành cài đặt:

python setup.py install

Sau khi cài đặt thành công:

Đọc dữ liệu

Tạo trước một file excel để demo như sau:

Đọc dữ liệu từ file trên

import xlrd
file_location = "D:/data_demo.xlsx"
wb = xlrd.open_workbook(file_location)
sheet = wb.sheet_by_index(0)
print sheet.nrows
print sheet.ncols
print sheet.cell_value(3, 1)

Giải thích:

  • Dòng 1: Import gói xlrd.
  • Dòng 2: file_location lưu vị trí của file data_demo.xlsx
  • Dòng 3: Truy cập đến file excel ở trên thông qua biến wb.
  • Dòng 4: Truy cập đến sheet mong muốn trong file. Nếu muốn truy cập đến sheet n của file thì giữa 2 dấu ngoặc tròn là n-1.
  • Dòng 5: In ra số dòng của bảng.
  • Dòng 6: In ra số cột của bảng.
  • Dòng 7: Giá trị tại vị trí dòng 3+1 cột 1+1. Tức vị trí B4 trong bảng tính.

Lấy dữ liệu trên một cột hay một dòng

Ví dụ 1:

for rows in range(sheet.nrows):
	print sheet.cell_value(rows, 0)

Ví dụ in ra tất cả các giá trị của cột đầu tiên.

Ví dụ 2:

for col in range(sheet.ncols):
	print sheet.cell_value(0, col)

Ví dụ in ra tất cả các giá trị của dòng đầu tiên.

Lấy toàn bộ dữ liệu của bảng

data = [[sheet.cell_value(r, c) for c in range(sheet.ncols)] for r in range(sheet.nrows)]

Dòng lên trên giúp lấy toàn bộ dữ liệu trong bảng lưu vào data. Biến data này mang kiểu dữ liệu giống như là một mảng 2 chiều. Vì vậy khi muốn lấy giá trị nào từ bảng, lấy thông qua biến data này tương tự ví dụ sau:

In ra giá trị của cột B4 tức Mido Lê:

print data[3][1]

Demo

Kết quả:

Download file demo.zip.

IO Stream

IO Stream Co., Ltd

30 Trinh Dinh Thao, Hoa Thanh ward, Tan Phu district, Ho Chi Minh city, Vietnam
+84 28 22 00 11 12
developer@iostream.co

383/1 Quang Trung, ward 10, Go Vap district, Ho Chi Minh city
Business license number: 0311563559 issued by the Department of Planning and Investment of Ho Chi Minh City on February 23, 2012

©IO Stream, 2013 - 2024