我将序言说我是堆栈标准的编程n00b.我有数据分析和脚本编写的经验 – 这是我在金融公司专业做的事情 – 但我不知道我在后端做了什么.
我正在尝试开始使用pandas和python —远离matlab / vba,但我无法弄清楚如何安装pandas库.
当我尝试导入pandas时,我得到一个numpy模块不存在的错误.我试着安装ezsetup / pip(不知道这是什么btw)…我不知道在哪里输入这个命令$python get-pip.py
有时当我尝试导入pandas时我得到一个错误,无法导入名称表hashable
我不知道这意味着什么,我没有到达任何地方.
更新
好的我安装了anaconda,它似乎允许我直接从控制台导入numpy和pandas.当我尝试编写基本时间序列并使用pandas语法绘制它时,我得到一个“系列未定义”的错误,因此我不确定它是否真的有效
In [1]: import matplotlib.pyplot as plt
In [2]: ts = Series(randn(1000), index=date_range('1/1/2000', periods=1000))
In [3]: ts = ts.cumsum()
In [4]: ts.plot()
解决方法:
适用于Windows的第三方模块的最佳资源是Christoph Gohlke的Python Extension Packages for Windows存储库.每个模块都可以作为自解压.exe安装程序使用,与python.org版本的Python一起使用 – 确保为您的版本和体系结构获得正确的安装程序.
虽然NumPy
不需要任何其他软件包,但pandas
确实如此,所以请确保全部获得.安装顺序并不重要.
与Anaconda或Enthought这样的分发相比,这种资源的优势在于Gohlke博士能够使软件包保持最新,允许您运行最新版本的模块.此外,几乎所有模块都有多个Python版本,而其他一些发行版仅基于Python 2.7.
缺点是您需要单独安装每个软件包,并且没有用于处理依赖项的软件包管理器.