[TOC]

Python 常用数据分析框架

名称 解释
Numpy 数组,矩阵的存储,运算框架
Scipy 提供统计,线性代数等计算框架
Pandas 结构化数据的整合,处理框架
Statsmodel 常见的统计分析框架模型
Matplotlib 数据可视化框架

python 基础数据类型

名称 解释 示例
str 字符串 ‘a’, ‘2’
float 浮点数 1.23, 3.45
int 整数 3,5
bool 布尔 Ture, False
complex 复数 1+2j, 2 +0j

Python 数据格式转换

数据类型 转换函数
Str str()
Float float()
Int Int()
Bool bool()
Complex complex()

读取数据

1
2
import pandas as pd
csv = pd.read_csv('filename')

制图步骤

在进行描述性图展示时,制图分为以下四步:

  1. 整理原始数据:对初始数据进行预处理和清洗,已达到制图得要求。
  2. 明确表达的信息: 根据初始可用数据,明确分析要表达的信息。
  3. 确定比较的类型: 明确要表达的信息中对目标比较的类型。
  4. 选择图表类型: 选择合适的图表类型,进行绘制并展示。
1
2
3
4
5
6
7

a=>operation: 数据
b=>operation: 信息
c=>operation: 相对关系
d=>operation: 图形

a(right)->b(right)->c(right)->d