【课程目标】
自2019年,Python已经成为最受欢迎的语言,它简单易用、跨平台、功能强大、扩展性强,而且能够将其它语言编写的程序融合起来,实现无缝连接,号称是万能胶水语言。
本课程为Python语言基础学习,通过本课程的学习,达到如下目的:
1、 掌握Python语言基础知识(基本语句、标准数据结构)
2、 熟悉数据分析标准过程,学会搭建数据分析框架
3、 掌握Pandas库功能,掌握常用的统计分析方法
4、 掌握Excel自动化操作
【授课时间】1-2天时间(要根据学员的实际情况调整重点内容及时间)
【授课对象】要求有Python基础的人员
【学员要求】
课程为实战课程,要求:
1、 每个学员自备一台便携机(必须)。
2、 便携机中事先安装好Python 3.10版本及以上。
注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
【授课方式】
语言基础 + 原理讲解 + 案例演练 + 开发实践 + 可视化呈现
采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
第一部分: 数据分析过程
1、 数据分析三个阶段
现状分析
原因分析
预测分析
2、 数据思维的三个环节
3、 数据分析的六个步骤
步骤1:明确目的--理清思路
步骤2:数据收集—理清思路
步骤3:数据预处理—寻找答案
步骤4:数据分析--寻找答案
步骤5:数据展示--观点表达
步骤6:报表撰写--观点表达
演练:如何搭建用户购买行为的数据分析框架
第二部分: 数据操作基础
1、 简化的Python操作过程
2、 数据分析常用扩展包
Numpy数组处理支持
Pandas数据分析和探索工具
Matplotlib可视化工具库
3、 数据集读写
读取文件(CSV、Excel)
数据集保存(CSV、Excel)
4、 数据集结构
数据集基本属性
Index:位置索引、标签索引
Series:一维结构
DataFrame:二维结构
5、 数据集基本操作
数据访问
字段类型
² 类型检查
² 类型转换
² 定义有序类别变量
排序
² 按值排序
² 按索引排序
数据筛选
数据修改
数据删除
演示:数据读取,访问,预处理,筛选
第三部分: 统计分析方法篇
1、 统计分析基础
统计分析的关键要素
统计分析三个步骤
2、 六种统计操作
描述统计describe
分类计数value_counts
分段计数/分箱计数value_counts(bins)
分类汇总(groupby, count/sum/mean/…)
透视表(多维统计分析)pivot_table
按日期汇总resameple/to_period
案例实战:掌握常用的Python统计函数/方法
3、 五种统计分析方法
对比分析法(不同用户的消费水平差异)
结构分析法(用户的学历结构、收入结构分析、动态结构分析)
分布分析法(用户的年龄分布、用户消费层次)
交叉分析法(产品偏好分析)
趋势分析法(销售淡旺季节、用户活跃时间)
案例实战:掌握常用的统计分析方法
第四部分: Excel表格自动化操作
1、 Excel自动化常用操作库
openyxl库
xlwings库
2、 Excel对象层次结构
Sheet,cell,image,chart,table
3、 Workbook文档对象属性及操作
4、 Sheet工作表对象属性及操作
5、 Cell单元格对象属性及操作
6、 工作表与DataFrame对象转换
7、 Chart图表对象属性及操作
8、 Xlwings插件与Python的互操作
9、 使用宏调用Python代码
10、 Excel中调用Python编写的UDF函数
结束:课程总结与问题答疑。


李真顺
周远祥
欧德张
孟晓苏
刘大成
殷大奎
曾凤
庞国明