What is the difference between "mean" and "median" in statistics field?
[ 跟贴目录 ] [ 返回论坛 ]
Edwin 于 2000/12/01 01:41:56 发表在 汉英
[ 回应主贴 ]
[ 返回论坛 ]
跟贴目录:
mean-平均数 median-中位数
作者:CC - 2000/12/01 02:14:22
***
[ 回应此贴 |
查看原贴 ]
Yes. Here are a few examples.
作者:wo - 2000/12/01 02:36:37
***
The mean for 2,3,7,8 is (2+3+7+8)/4=5; the median for 1,2,3,4,5 is -,-,3,-,- while the median for 2,3,7,8 is (3+7)/2=5. Another useful word in this context is "mode"(众数),which means the largest among a group of numbers, e.g. the mode for 2,3,7,8 is 8. Just happened to have learned it some years ago.
[ 回应此贴 |
查看原贴 ]
mode should be the data value that appears most often in the data set (in the discrete case)
作者:新学生 - 2000/12/01 10:30:23
***
2,3,3,7,8. mode is 3 since 3 appeared twice while the other numbers only once.
[ 回应此贴 |
查看原贴 ]
中位数即把总体单位的某一标志值按大小顺序排列,居于中间位置之值便是。
作者:CC - 2000/12/01 02:20:48
***
[ 回应此贴 |
查看原贴 ]
definition for median, mean, and mode
作者:007 - 2000/12/01 14:23:14
***
Median
The value which has an equal number of values greater and less than it. For an even number of values, it is the mean of the two middle values.
Mean
Meana value that is calculated by dividing the sum of terms by the number of terms. Also known as an average.
Mode
A value in a set of data that occurs most often.
So "wo"'s examples about mean and median are right. "新学生"s example about mode is right.
[ 回应此贴 |
查看原贴 ]
Thanks a lot!
作者:edwin - 2000/12/01 18:18:30
***
[ 回应此贴 |
查看原贴 ]
Mean,Median and Mode: 须考虑概率(频率、比例、权重、比重)因素
作者:学而 - 2000/12/01 18:49:49
***
统计学上这三个参数,表征着数据样本的比重(术语为“权重”:weight)特点,
统称“Measures of Central Trend”,即反映其中心特点。以人口年龄为例:
0-110岁的 mean 未必等于 55 即(0+1+2+...+110)/111, median 未必等于 56
(0-110的中间值),mode 也未必等于 110。如果人口中年青人居大多数,这三
个参数都会比55小。换句话说,年青人比重(比例)较大,有较大的权重,或者
说年青人计数频率高,或者说碰到年青人的概率较大。
精确一点说 --
Mean = 相加(各岁数x该岁数人口) 除以 总人口。
Median: 将人口分为相等两半的年龄。如果50%的人口在35岁以下,并包括一部分
35岁的人,median=35; 如果50%的人口是35岁全体和35岁以下的人口,换言之,
50%的人口是36岁全体和36岁以上,那么,median=35.5 。
Mode: 人口最多的年龄。可以是一个年龄,也可以是几个年龄,如果这些年龄的人
口都是最大数(自然也就相等)。
wo 的例子是特殊情况,即各个值的发生的频率都是相等的(都只出现1次),所以
mean 和 median 有那样的算法。007,CC 所引的关于median的定义,也属于这种
特殊情况。关于 mode 的解释,007和新学生的意见是对的。
[ 回应此贴 |
查看原贴 ]
谢谢您的科普!
作者:he zi - 2000/12/01 22:32:15
***
我理解,5, 5, 5, 6, 6, 7,您是把它看成5, 6, 7三个数(distinctive),所以讲权重; 而在前引概念中则当它是六个数,因此不引入权重概念。 两者本质上是一样的,并不是特例和一般例子的关系。当然,在样本较大的情况中,引入权重概念虽没有改变定义本身,但确实大大简化了实际的计算操作。您认为这样说对吗?
[ 回应此贴 |
查看原贴 ]
如果只是离散数
作者:学而 - 2000/12/02 01:31:34
***
如果只在离散数域内谈 mean,大概没有什么本质区别。反正是把所有数据加在一起,
再除以观测总数。对于连续数,就无法离开权重概念。
median: 对连续数,当然不开权重概念;对离散数,定义则要小心。如您所举的例子:
5, 5, 5, 6, 6, 7
试用007所引的定义:
"The value which has an equal number of values greater and less than it.
For an even number of values, it is the mean of the two middle values."
这里有可能发生问题的就是 number of values -- 容易理解成只有3个:5,6,7。
那么,如果不引入权重,就会把 6 看成 median。除非说 number of values 是
6 个,这当然可以解决问题。不过,一般是说 number of observations, 或 sample
size,等等。
至于 mode,本身就是定义在权重概念上的,无需多言。
(注:hz的例子,mean=(5+5+5+6+6+7)/6=5.7; median=5.5; mode=5)
谢深入探讨!
[ 回应此贴 |
查看原贴 ]
是啊,各位前面举的例子不全是离散数吗?
作者:he zi - 2000/12/02 08:16:28
***
所以我的comment也是在这个范围内。 从分立变到连续,权重(比重)的概念确实就很重要了。谢展开讨论!:-)
[ 回应此贴 |
查看原贴 ]
补充
作者:学而 - 2000/12/02 09:32:39
***
虽然例子是离散的,但作为概念来说 mean, median, mode 则适用于离散和
连续。概念也应该是统一的。离散的例子容易讲得通俗一些。
再有,就算只局限于离散域中,如果 population size 未知,如何定义
population 的 mean, median 和 mode 呢?这时,只能乞灵于概率或权重
了。
[ 回应此贴 |
查看原贴 ]
对啊,要给例子就总是特例不是?
作者:he zi - 2000/12/02 10:36:18
***
我已经说了, 我原来的comment是建立在各位所举例子的基础上和类型内。 我想说的是在这个意义上,谈不到“必须”引入权重概念;不引入此概念的定义同样是普适的(即不只适用于各元素仅出现一次的情况)。但如果您说前面的说法容易引起误解,或展开地说它不便向连续情形推广,或您讨论时本来心里就有“连续情形”这个context, 我想那都是另外的问题了。这样展开来,恐怕就不是这里的三两句话能够讲得完备、准确而清晰的了;而且看来也不是特别必要?因为我相信我们的理解没有区别。那就容我“止于至善”吧:-) 多谢!
[ 回应此贴 |
查看原贴 ]
勘误(Mean,Median and Mode: 须考虑概率(频率、比例、权重、比重)因素)
作者:学而 - 2000/12/02 09:17:30
***
误:median 未必等于 56 (0-110的中间值),
正:median 未必等于 55 (0-110的中间值),
各值如出现概率相等(例如只出现1次),则 mean = median, mode 无意义
(取值范围内任何值都可以看成mode)。此即所谓“一致分布”(Uniform distribution)。
[ 回应此贴 |
查看原贴 ]
all this is probably more than mr. edwin wanted to know. but just to be sure...
作者:新学生 - 2000/12/02 14:51:46
***
there is a crucial difference between Mr. Xue Er's explanation
and the examples that most of us offered. the rest of us have
been talking about SAMPLE mean/median/mode and then Mr. Xue Er
correctly pointed out that mean/median/mode should be regarded
as population parameters without the keyword "sample". it was an
oversight on my part. apologies. and thanks to mr. xue er for
making this distinction clear.
when you have a sample (consisting of n observations/numbers), without
further knowledge of the underlying distribution, we should give these
n numbers equal weights (usually 1/n). thus, we can compute the sample
mean safely by using the sample average.
sample mean and sample median make sense for continuous or discrete populations
while sample mode only makes sense if the underlying population is discrete.
i realize that this is probably pretty confusing without some really detailed
examples. sorry folks, don't have time for that. besides, like i said, this
is more than you care to know anyway.
[ 回应此贴 |
查看原贴 ]
[ 跟贴目录 ] [ 返回论坛 ]