100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > python做面板数据分析_Python线性模型在稀疏数据上的面板数据回归

python做面板数据分析_Python线性模型在稀疏数据上的面板数据回归

时间:2018-10-28 01:29:38

相关推荐

python做面板数据分析_Python线性模型在稀疏数据上的面板数据回归

我试图对面板数据进行多元回归分析。我需要用不同的因变量运行成百上千的回归,并将所有结果存储在一个数据结构中,以便以后查看。我使用Python并使用statsmodels运行回归,但不使用公式,因为它们使依赖变量更难循环。我正在尝试使用linearmodels包调整固定效果,但失败了。在

似乎我的问题是我的数据集非常稀疏;它包含很多“NaN”。在我看来,pandas包含一个数据结构data.set_索引('time','entity'),我可以用它来运行面板数据回归,控制固定效果。但是当我通过这个函数发送我的数据集时,它似乎会自动删除整个数据集中带有“NaN”的每一行,这会删除每一行,程序就会退出。在

当使用statsmodels的回归时,我可以删除回归函数OLS(y,x,missing='drop')中缺少的值。有没有办法在控制固定效果的同时做到这一点?或者用其他方法控制Python中非常稀疏的数据集中的固定效果?还是我错过了什么?在

例如,假设数据集是一个数据帧:dataSet = {'entity': ['northpole', 'northpole', 'northpole', 'southpole', southpole', 'southpole'], 'time': [, , , , , ], 'col1': [1, 3, 5, 3, 1, -1], 'col2' : [1, 4, 7, 4, 1, -2], 'col3': [NaN, NaN, 4, 5, 3, 0], 'col4': [4, 5, NaN, NaN, NaN, NaN]}

dataSetNew = dataSet.set_index('entity', 'time'])

variable = PanelOLS(dataSetNew.col1, dataSetNew.col2, entity_effects = True, time_effects = True)

程序没有完成数据集的计算。它会显示以下错误消息:

^{pr2}$

之后就退出了。在

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。