1.安装
安装Python2.7: hownloads/release/python-2712/ 根据电脑配置选择合适版本下载安装。
安装过python之后,Python27\Scripts有pip.exe,在Python27\Scripts文件夹下运行cmd(点击Shift+右键),可以用pip安装其他包。
1. 安装科学计算库
pip install jupyter
pip install pandas
pip install numpy
pip install matplotlib
pip install seaborn
pip install scikit-learn
2. 用上述方式安装scipy不成功,可以这样:在ci.edu/~gohlke/pythonlibs/下载合适的whl包,pip install <拖入下载到的scipy包>。安装后import scipy若提示缺少numpy+MKL,可以pip uninstall numpy,再下载numpy+MKL的whl包,pip install *.whl。
检测安装是否成功,打开Python的shell,输入:
import matplotlib
import numpy
import scipy等,若不报错,就安装成功。
比如生成一个y=x的直线:
import matplotlib.pyplot as plt
plt.plot([1,2,3])
plt.ylabel('some numbers')
plt.show()1234
测试scikit-learn安装成功与否,下载代码plot_ols.py,运行得到:
上述是我采用的安装方式,过程比较顺利,除了pip,还有其他的方式哈:
1. 用easy_install安装,但是这种方法卸载不方便,不推荐。
2. 用anaconda的conda命令,好像也很常用,因为conda会安装或者更新一些依赖库,但是pip未必。有兴趣的可以试试。
2. 科学计算库的使用
综合:
1. 遇到Numpy陌生函数,查询用法
2. pandas教程及API
pandas读取csv文件,提供了大量能使我们快速便捷地处理数据的函数和方法。
3. Matplotlib Tutorial(译)
是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。
数据可视化:
1. Seaborn tutorial
Seaborn模块自带许多定制的主题和高级的接口,来控制matplotlib图表的外观。
机器算法:
1. scikit-learn
scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理,机器学习模型非常丰富,包括SVM,决策树,GBDT,KNN等等,可以根据问题的类型选择合适的模型,具体可以参考官方网站上的文档。