Git Product home page Git Product logo

scanfyu / statsmodels Goto Github PK

View Code? Open in Web Editor NEW

This project forked from squidxwh/statsmodels

0.0 1.0 0.0 46.87 MB

Statsmodels: statistical modeling and econometrics in Python

Home Page: http://www.statsmodels.org/devel/

License: BSD 3-Clause "New" or "Revised" License

Python 93.78% Assembly 0.08% AGS Script 3.47% HTML 1.12% R 0.79% Stata 0.49% C 0.01% MATLAB 0.02% Rebol 0.01% Shell 0.11% Batchfile 0.01% Fortran 0.13%

statsmodels's Introduction

为什么翻译

本人会计出身,转行数据分析(更多是用excel、sql、spss等工具),30岁开始入坑python,在学习statsmodels包的过程中,在知乎、百度、CSDN和github上均没有找到statsmodels的中文文档,一开始以为 ApacheCN 开源组织(号称一群有想法,爱装逼,爱斗图,有活力,爱搞事,爱吃辣条的朋友)已经翻译了该包的文档,最后发现他们只是翻译该文档的目录,为了更好地入坑,我只好用我那拙劣的英语、再加上谷歌翻译,苦逼的翻译2周,也仅仅是把docs文件夹下的文件翻译完(未校验),水平有限,请大家多担待。翻译这个活没有什么技术可言,但真的很苦逼。所以真的非常的感谢 ApacheCN 开源组织在我学习的过程中贡献的各种中文文档,非常感谢!

关于统计模型

statsmodels是一个Python软件包,为scipy提供了补充,以进行统计计算,包括描述性统计以及统计模型的估计和推断。

statsmodels主要包括如下子模块:

回归模型:线性回归,广义线性模型,稳健的线性模型,线性混合效应模型等等。

方差分析(ANOVA)。

时间序列分析:AR,ARMA,ARIMA,VAR和其它模型。

非参数方法: 核密度估计,核回归。

统计模型结果可视化。

比较:statsmodels更关注统计推断,提供不确定估计和参数p-value。相反的,scikit-learn注重预测。

主要特点

  • 线性回归模型:
    • 普通最小二乘法
    • 广义最小二乘法
    • 加权最小二乘法
    • 具有自回归误差的最小二乘
    • 分位数回归
    • 递归最小二乘法
  • 具有混合效应和方差成分的混合线性模型
  • GLM:支持所有单参数指数族分布的广义线性模型
  • 用于二项式和泊松的贝叶斯混合GLM
  • GEE:单向聚类或纵向数据的广义估计方程
  • 离散模型:
    • Logit 和 Probit
    • 多项 logit (MNLogit)
    • 泊松和广义泊松回归
    • 负二项式回归
    • 零膨胀计数模型
  • RLM: 鲁棒的线性模型,支持多个 M 估计器。
  • 时间序列分析:时间序列分析模型
    • 完整的StateSpace建模框架
      • 季节性ARIMA和ARIMAX模型
      • VARMA和VARMAX模型
      • 动态因子模型
      • 未观测到的组件模型
    • 马尔可夫切换模型(MSAR),也称为隐马尔可夫模型(HMM)
    • 单变量时间序列分析:AR,ARIMA
    • 矢量自回归模型,VAR和结构VAR
    • 矢量误差修正模型,VECM
    • 指数平滑,Holt-Winters
    • 时间序列的假设检验:单位根,协整和其他
    • 用于时间序列分析的描述性统计数据和过程模型
  • 生存分析:
    • 比例风险回归(Cox模型)
    • 生存者函数估计(Kaplan-Meier)
    • 累积发生率函数估计
  • 多变量:
    • 缺失数据的主成分分析
    • 旋转因子分析
    • MANOVA
    • 典型相关
  • 非参数统计:单变量和多变量核密度估计
  • 数据集:用于示例和测试的数据集
  • 统计:广泛的统计检验
    • 诊断和规格检验
    • 拟合优度和正态性检验
    • 多元测试函数
    • 各种其他统计检验
  • 使用MICE进行插补,秩序统计回归和高斯插补
  • 调解分析
  • 图形包括用于数据和模型结果的可视化分析的绘图功能
  • 输入/输出
    • 用于读取Stata .dta文件的工具,但pandas具有较新的版本
    • 表输出到ascii,latex和html
  • 其他模型
  • Sandbox:statsmodels包含一个 sandbox 文件夹,其中包含处于开发和测试各个阶段的代码, 因此不被视为“生产就绪”。其中包括:
    • 广义矩法(GMM)估计器
    • 核回归
    • scipy.stats.distributions的各种扩展
    • 面板数据模型
    • 信息理论测度

如何获得

GitHub上的master分支是最新的代码

https://www.github.com/statsmodels/statsmodels

发行标签的源代码下载可在GitHub上获得

https://github.com/statsmodels/statsmodels/tags

二进制文件和源代码发行版可从PyPi获得

https://pypi.org/project/statsmodels/

二进制文件可以安装在Anaconda中

conda install statsmodels

statsmodels's People

Contributors

alexbrc avatar bartbkr avatar bashtage avatar chadfulton avatar enricogiampieri avatar evgenyzhurko avatar fperez avatar j-grana6 avatar jarrodmillman avatar jbrockmendel avatar josef-pkt avatar jseabold avatar kshedden avatar langmore avatar lbybee avatar matthew-brett avatar padarn avatar phobson avatar rgommers avatar scottwpiraino avatar thequackdaddy avatar tomaugspurger avatar tvanzyl avatar tyleha avatar vincentarelbundock avatar vincentdavis avatar wesm avatar yarikoptic avatar yl565 avatar yogabonito avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.