本帖最后由 Primummovens 于 2023-7-12 07:03 编辑
告诉你为什么数据要取对数 - 计量经济学与统计软件 - 经管之家(原人大经济论坛) (pinggu.org)
关于PV=P*V,为什么能取对数转换成ln PV = ln P + ln V
平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有: 1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了。
2. 取对数后,可以将乘法计算转换称加法计算。
3. 某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。
从log函数的图像可以看到,自变量x的值越小,函数值y的变化越快, 列如在500和200,800和500,虽然他们之间都只相差300, 但log500-log200>log800-log500,因为前面一对的比后面一对更小。
也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这也是符合生活常识的,例如对于价格,买个家电,如果价格相差几百元能够很大程度影响你决策,但是你买汽车时相差几百元你会忽略不计了。
4. 取对数之后不会改变数据的性质和相关关系(也就是不改变其是+还是-,不改变其是x^2还是x^3的趋势),但压缩了变量的尺度,例如800/200=4, 但log800/log200=1.2616,数据更加平稳,也消弱了模型的共线性、异方差性等。 https://www.desmos.com/calculator?lang=zh-CN 试着填入 x^2,对比其 ln x^2,填入 x^3,对比其 ln x^3,还有(800/200)x和(log 800/log 200)x 会发现,虽然很抽象,但是相关关系是一样的,都是该加加,该减减,不改变其正相关,负相关,还是不相关的相关关系。
5. 所得到的数据易消除异方差问题。
6. 在经济学中,常取自然对数再做回归,这时回归方程为 lnY=a lnX+b ,两边同时对X求导,1/Y*(DY/DX)=a*1/X, b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。
当然,如果数据集中有负数当然就不能取对数了。实践中,取对数的一般是水平量,而不是比例数据,例如变化率等。 ========================================================= 再细节和具体的的可以读读伍德里奇的《计量经济学》从开始到第二章2.4,我读了几个小时读得头疼,估计还要多花点时间。
|