Thủ Thuật Hướng dẫn Hướng dẫn dùng dataframe fillna python Mới Nhất
Lã Hiền Minh đang tìm kiếm từ khóa Hướng dẫn dùng dataframe fillna python được Cập Nhật vào lúc : 2022-09-26 04:06:19 . Với phương châm chia sẻ Bí quyết Hướng dẫn trong nội dung bài viết một cách Chi Tiết Mới Nhất. Nếu sau khi tham khảo nội dung bài viết vẫn ko hiểu thì hoàn toàn có thể lại phản hồi ở cuối bài để Mình lý giải và hướng dẫn lại nha.Phương thức pandas.DataFrame.fillna () được sử dụng để điền vào cột (một hoặc nhiều cột) chứa NA / NaN / None với 0, trống, trống hoặc bất kỳ giá trị được chỉ định nào, v.v. NaN được xem là một giá trị bị thiếu. Khi bạn xử lý máy học, việc xử lý những giá trị bị thiếu là rất quan trọng, không xử lý những giá trị này sẽ dẫn đến tác dụng phụ với kết quả không đúng chuẩn.
Nội dung chính- 1. Ví dụ nhanh về pandas fillna ()3. pandas fillna NaN với Không giá trị4. gấu trúc điền vào một cột5. điền vào nhiều cột6. Điền với thông số giới hạn7. Hoàn thành Ví dụ về pandas fillnaSự kết luậnNgười giới
thiệu
Tệp CSV nhận được từ những nguồn của bên thứ ba, hầu hết thời gian nó có mức giá trị null cho khoảng chừng trống / trống. Bằng cách sử dụng pandas.read_csv (), chúng tôi hoàn toàn có thể tải tệp CSV vào DataFrame và pandas quy đổi tất cả những giá trị null thành NaN trong DataFrame.
Bạn hoàn toàn có thể thả những hàng có mức giá trị NaN bằng pandas.DataFrame.dropna () hoặc xử lý NaN bằng phương pháp điền những giá trị rõ ràng bằng phương thức fillna ().
pandas fillna Key Points
- Nó được sử dụng để điền những giá trị NaN với những giá trị được chỉ định (0, trống, v.v.).Nếu bạn muốn xem xét vô cùng
(inf và -inf) được NA trong tính toán, bạn hoàn toàn có thể đặt pandas.options.mode.use_inf_as_na = True.Ngoài NaN, gấu trúc None cũng coi như mất tích.
Liên quan: gấu trúc thả hàng & cột với NaN bằng phương pháp sử dụng dropna ()
- 1. Ví dụ nhanh về pandas fillna ()2. Cú pháp pandas.DataFrame.fillna ()3. pandas
fillna NaN với Không giá trị4. gấu trúc điền vào một cột5. điền vào nhiều cột6. Điền với thông số giới hạn7. Hoàn thành Ví dụ về pandas fillna
- Sự kết luậnNgười ra mắt
1. Ví dụ nhanh về pandas fillna ()
Dưới đây là những ví dụ nhanh về cung và cách sử dụng phương thức pandas fillna ().
# fillna() on all columns df2=df.fillna('None') # fillna() on once column df2['Discount'] = df['Discount'].fillna(0) # fillna() on multiple columns df2[['Discount','Fee']] = df[['Discount','Fee']].fillna(0) # fillna() on multiple columns with different values df2 = df.fillna(value='Discount':0,'Fee':10000) # fill with limit df2=df.fillna(value='Discount':0,'Fee':0,limit=1)Dưới đây là cú pháp của phương thức pandas.DataFrame.fillna (). Điều này nhận giá trị tham số, phương thức, trục, vị trí, số lượng giới hạn và truyền xuống và trả về một DataFrame mới. Khi inplace = True được sử dụng, nó trả về Không có khi thay thế xảy ra trên đối tượng DataFrame hiện có.
# Syntax of pandas.DataFrame.fillna() DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)- value – Sử dụng vô hướng, dict, Series hoặc DataFrame nhưng không sử dụng list.method – Lấy
một trong những giá trị sau ‘backfill “,” bfill “,” pad “,” ffill “, None. Mặc định Không có.axis – 0 hoặc ‘chỉ mục’, 1 hoặc ‘cột’. Được sử dụng để trục xác định để điền những giá trị.inplace – Sai mặc định. Khi được sử dụng True, nó update đối tượng DataFrame hiện có.limit – Chỉ định số lần điền sẽ xảy ra. Đây là số giá trị NaN liên tục lớn số 1 được thay thế bằng giá trị đã chỉ
định.
downcast – Nó sử dụng một cặp khóa-giá trị dict chỉ định kiểu tài liệu cho downcast. Giống như Float64 đến int64ngày thành chuỗi, v.v.
Hãy tạo một DataFrame
# Create DataFrame import pandas as pd import numpy as np df = pd.DataFrame(( 'Courses':["Spark",'Java',"Scala",'Python'], 'Fee' :[20000,np.nan,26000,24000], 'Duration':['30days','40days','NA','40days'], 'Discount':[1000,np.nan,2500,None] )) print(df)3. pandas fillna NaN với Không giá trị
Phương thức fillna () được sử dụng để điền những giá trị NaN / NA trên một cột được chỉ định hoặc trên toàn bộ DataaFrame với bất kỳ giá trị nhất định nào. Bạn hoàn toàn có thể chỉ định sửa đổi bằng phương pháp sử dụng tại chỗ hoặc số lượng giới hạn số lần điền để thực hiện hoặc chọn một trục có điền vào những hàng / cột hay là không, v.v. Ví dụ Dưới đây điền vào tất cả những giá trị NaN bằng Không có mức giá trị nào.
# fillna to replace all NaN df2=df.fillna('None') print(df2) # Outputs # Courses Fee Duration Discount #0 Spark 20000.0 30days 1000.0 #1 Java None 40days None #2 Scala 26000.0 None 2500.0 #3 Python 24000.0 40days NoneĐể update việc sử dụng DataFrame hiện có df.fillna(‘None’, inplace=True). Bạn cũng hoàn toàn có thể sử dụng phương thức pandas.DataFrame.replace () để thay thế NaN bằng giá trị 0. tương tự, bạn cũng hoàn toàn có thể thay thế NaN bằng chuỗi trống hoặc chuỗi trống.
4. gấu trúc điền vào một cột
Ví dụ trên đã điền tất cả những giá trị NaN trên toàn bộ DataFrame. đôi khi bạn chỉ việc thay thế trên một cột, bạn hoàn toàn có thể làm như vậy bằng phương pháp chọn cột DataFrame cho phương thức fillna ().
# fillna on one column df2['Discount'] = df['Discount'].fillna('0') print(df2) # Outputs # Courses Fee Duration Discount #0 Spark 20000.0 30days 1000.0 #1 Java None 40days 0 #2 Scala 26000.0 None 2500.0 #3 Python 24000.0 40days 05. điền vào nhiều cột
Sử dụng phương thức pandas fillna () để điền một giá trị được chỉ định trên nhiều cột DataFrame, những cột update ví dụ phía dưới Discount và Fee 0 cho những giá trị NaN.
# fillna() on multiple columns df2[['Discount','Fee']] = df[['Discount','Fee']].fillna('0') print(df2) #Outputs Courses Fee Duration Discount 0 Spark 20000.0 30days 1000.0 1 Java 0 40days 0 2 Scala 26000.0 None 2500.0 3 Python 24000.0 40days 0Bây giờ, hãy xem cách điền giá trị rất khác nhau cho từng cột. Cột update ví dụ dưới đây Discount 0 và cột Fee 10000 cho những giá trị NaN.
# fillna() on multiple columns df2 = df.fillna(value='Discount':'0','Fee':10000) print(df2) # Outputs # Courses Fee Duration Discount #0 Spark 20000.0 30days 1000.0 #1 Java 10000.0 40days 0 #2 Scala 26000.0 NaN 2500.0 #3 Python 24000.0 40days 06. Điền với thông số số lượng giới hạn
Để trấn áp cách điền những giá trị NaN, hãy sử dụng limit tham số. So sánh kết quả dưới đây với kết quả trên để thấy sự khác lạ.
# fill with limit df2=df.fillna(value='Discount':0,'Fee':0,limit=1) print(df2) # Outputs # Courses Fee Duration Discount #0 Spark 20000.0 30days 1000.0 #1 Java 0.0 40days 0.0 #2 Scala 26000.0 NaN 2500.0 #3 Python 24000.0 40days NaN7. Hoàn thành Ví dụ về pandas fillna
import pandas as pd import numpy as np df = pd.DataFrame(( 'Courses':["Spark",'Java',"Scala",'Python'], 'Fee' :[20000,np.nan,26000,24000], 'Duration':['30days','40days',np.nan,'40days'], 'Discount':[1000,np.nan,2500,None] )) print(df) # fillna() on all columns df2=df.fillna('None') print(df2) # fillna() on once column df2['Discount'] = df['Discount'].fillna(0) print(df2) # fillna() on multiple columns df2[['Discount','Fee']] = df[['Discount','Fee']].fillna(0) print(df2) # fillna() on multiple columns df2 = df.fillna(value='Discount':0,'Fee':10000) print(df2) # fill with limit df2=df.fillna(value='Discount':0,'Fee':0,limit=1) print(df2)Sự kết luận
Trong bài này, bạn đã học phương thức DataFrame fillna () để điền vào một cột, nhiều cột chứa NaN với một giá trị xác định. Cũng đã học cách thay thế những giá trị rất khác nhau cho từng cột.
Học vui vẻ !!