博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python数据分析中对重复值、缺失值、空格的处理
阅读量:4580 次
发布时间:2019-06-09

本文共 526 字,大约阅读时间需要 1 分钟。

对重复值的处理

把数据结构中,行相同的数据只保留一行

函数语法:

    drop_duplicates()

from pandas import read_csvdf = read_csv(文件位置)newdf = df.drop_duplicates();

 

对缺失值的处理

缺失值的产生

    1、有些信息暂时无法获取

    2、有些信息被遗漏或者错误处理了

缺失值的处理方式

    1、数据补齐

    2、删除对应缺失行

    3、不处理

 

缺失值处理

    dropna函数的作用:去除数据结构中值为空的数据

    dropna函数语法:dropna()

from pandas import read_csvdf = read_csv(文件的位置)newdf = df.dropna()

对空格值的处理

strip函数的作用:清除字符型数据左右的空格

strip函数的语法:strip()

from pandas import read_csvdf = read_csv(文件的位置)newdf = df [数据中的一个列名].str.strip()df[被处理的列名]= newdf

 

转载于:https://www.cnblogs.com/circleyuan/p/10350200.html

你可能感兴趣的文章
联想小新Air 15 安装黑苹果macOS High Sierra 10.13.6过程
查看>>
公共POI导出Excel方法–java
查看>>
次短路——Dijkstra
查看>>
Enter Query Mode Search Tricks Using Enter_Query Built-in in Oracle Forms
查看>>
Form属性、内置子程序、触发器、系统变量
查看>>
广州夜景一
查看>>
JVM(2)--一文读懂垃圾回收
查看>>
游戏开发——战斗系统设计技巧
查看>>
Android ROM 制作教程
查看>>
Android模拟器使用SD卡
查看>>
STL学习笔记(关联式容器)
查看>>
FMDataBase 打开sqlite的外键约束功能
查看>>
二分图
查看>>
UVA10559&POJ1390 Blocks 区间DP
查看>>
[bzoj 3289] Mato的文件管理
查看>>
Flutter学习笔记(五)
查看>>
vSphere的exsi root密码忘记了
查看>>
svn的安装过程
查看>>
NSCopying简析
查看>>
oracle 用户 角色 权限
查看>>