1人赞同了该回答
大概的学习流程如下,在用python进行数据分析的时候通常用的两个包是numpy和pandas
一、一维数据分析
在pandas中的一维数据结构Series, 在numpy中的一维数据结构叫array,
panads的series是基于numpy的array,并且功能更多,必须先掌握numpy的array。
1.Numpy一维数组
其实numpy的一维数组的定义和查询和列表是类似的
2.Numpy一维数组与列表的区别
numpy 可以进行向量化运算,属于线性代数运算numpy数组中的元素都必须是同一种数据类型,而列表可以是不同的数据类型
3.panads 一维数据结构
4.获取描述统计信息
5.向量相加
二、二维数据分析
1.用Numpy 定义二维数组
2.查询元素
3.Numpy数轴参数
4. Pandas数据框(DataFrame)
有一个注意点:如果重新打开代码的时候,继续执行未执行完的代码,,可能会报错未导入包,所以在代码的开头重新导入包即可
5.定义有序数据框
6. iloc 属性用于根据位置查询值
7. loc 属性用于根据索引查询值
8.数据框复杂查询:切片功能
9.数据框复杂查询:条件判断
10.数据集描述统计信息
三、数据分析步骤
1.提出问题
‘’'从销售数据中分析出以下业务指标:
(1) 月均消费次数
(2) 月均消费金额
(3) 客单价
(4)消费趋势 ‘’’
2.理解数据
3.数据清洗步骤
选择子集
列名重命名
缺失数据处理
‘’'python 中缺失值有三种:
1) python内置的None值
在pandas 中,将缺失值表示为NA, 表示不可用not available
对于数值数据,pandas使用浮点值NAN(Not a number)表示缺失数据
后面出来数据,如果遇到错误:有float错误,就是有缺失值,需要处理掉
所以,缺失值有三种:None NA NaN’‘’
以后遇到缺失值无法删除提供了以下几种解决方法:
方法一:
【问】删除缺失值,发现没有删除掉
【答】按这个修改下格式就可以了
[https://stackoverflow.com/questions/39339935/pandas-dropping-rows-with-missing-data-not-working-using-isnull-notnull](https://link.zhihu.com/?target=
这个方法不是很实用,对于数据少量的情况下可以用
方法二:
【可能原因2】排查了一下确实是那个nan的问题。我数据分析的专用环境是nb,但是起先没切换过去,用了默认的base环境。切换kernal后就正常显示了NaN,并能dropna空值了。
进一步比对了一下两个环境,发现base环境的pandas和xlrd版本更旧一点点,更新之后就也可以正常使用了。
字符串转换为数值(浮点数)
处理日期
在源数据中如何处理日期问题
注意点:有人报错"float object has no attribute split"
是因为有空值,pandas中空值是浮点型,在没有去除空值的情况下,就切割
可能是因为是浮点型,其实是会参与运算
那None和NaN有什么区别呢:
None是Python的一种数据类型,NaN是浮点类型 两个都用作空值
0 2018-01-01
1 2018-01-02
2 2018-01-06
dtype: object
字符串转换日期
排序
by: 哪几列排序
ascending = True 表示升序排列,
ascending = False 表示降序排列,
na_position = True 表示排序的时候,把空值放到前列,这样可以比较清晰看到哪些地方又空值
通过观察以上描述统计信息我们发现,销售数量有负值,相应的应收金额和实收金额也有负值,这是不符合常理的
通过条件判断筛选出数据
删除异常值前: (6549, 7)
删除异常值后: (6506, 7)
构建模型
(1) 月均消费次数
业务指标 1: 月均消费次数 = 总消费次数/月份数
获取总消费次数
#获取时间范围
月份数: 6
业务指标1:月均消费次数= 890
(2) 月均消费金额
业务指标2:月均消费金额 = 50668.3516
(3) 客单价
客单价:56.9094
这份完整版的Python全套学习资料已经上传,朋友们如果需要可以点击链接免费领取或者滑到最后扫描二v码【】
需要的话可以点击这里ὄ;[CSDN大礼包:《python学习路线&全套学习资料》免费分享](安全链接,放心点击)
ὄ;一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
ὄ;二、Python必备开发工具
ὄ;三、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
ὄ; 四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(文末领读者福利)
ὄ;五、Python练习题
检查学习结果。
ὄ;六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
ὄ;因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传,朋友们如果需要可以扫描下方CSDN官方认证二维码或者点击链接免费领取【】
需要的话可以点击这里ὄ;[CSDN大礼包:《python学习路线&全套学习资料》免费分享](安全链接,放心点击)