--- 必须通过版
module 1 自学部分
knowledge clip
·基础概念
Cases - characteristics -➡ Variables
具体的人,组织 下面的分类 e.g. 头发颜色,年龄
【need to vary 变化】e.g. 每个 team 不同城市- variation 必须
Variable 变 量 Constant 常 数
Levels of measurement 老师总结
1. Interval vs. Ratio 的区别
difference order similar meaningful zero
• Interval:数据有固定间隔,但零点是人为设定的,不能进行倍数比较。
intervals point
• Ratio:数据有固定间隔,零点是绝对的(true zero),可以进行倍数计算(比如 “A 是 B 的
不能说明哪个 category 更好 nominal + - - -
两倍”)。
有顺序,比如比赛名次,但是区 ordinal + + - -
Categorical
2. 间分类不一定均等 e.g.满意度
为 “非常满意”比“满意”高,但
什 两者之间的差距可能不同于“满
么 意”和“一般”之间的差距。
Cels
ius 每个 category 区间差距 interval + + + -
温 都是一样的
Quantitative 是不是有绝对呢 0 ratio + + + +
点(不能是人为的)
度
是
Inte
rval
Discrete 离散型 set of separate numbers e.g. 进球个数 3
?
Continuous 连续型 infinite 无限的 region 区域 of values e.g. 身高 1.75
•
,原本有些人认为 Age 是 Interval 的例子,但其实它更常被归为 Ratio。
• 更好的 Interval 例子是 温度:
• 为什么? 因为 0°C 不是“真正的零”(不是完全没有温度)。
例如:
• 昨天是 10°C,今天是 20°C,但你不能说今天**“比昨天热两倍”**。
• 因为如果转换为 Fahrenheit:
• 10°C = 50°F
• 20°C = 68°F
• 这里的比例不同,说明 Celsius 的零点是人为设定的,而不是绝对的零点。
• 所以 Celsius 温度是 Interval。
介 绍 怎 么 去 order 和 present 这 些 case 和
variables
第 一 种 Data matrix 数 据 矩 阵
data matrix
|
all statistical analyses
|
summary of data
有一些缺失的信息我们需要删掉
Frequency table
hows the values are distributed over the cases
,1. Categorical
2.
recoded the variable 重新编码
体重从 66.3,66.4,66.5 这种 quantitative variable recoded 成了“2”所述
的 ordinal variable with 5 categories (这个变化是非常容易的,反着不可能)
总结
(1) data matrix -source- all statistical analyses
(2) present your finds- summary of data e.g frequency tables is necessary,
recoded ur quantitative variables into ordinal ones
, 各种表格
Categorical
pie chart:immediately percentage
bar chart:easily retrieve 提取 exact numbe(high number 适合 bar chart)
----- ----- ----- ----- ----- ----- ----- ----- ------ ------ ----- ----- ----- -----
quantitative
Summarize/visualize a quantitative variable: dot plot and histogram
many observation - histogram (underlying continuous scale)
— dot plot,useful when you have a same sample
Q1(第一个四分位数)是数据从最小值到中位数之间的中点。