我们都知道 Python 有很多第三方开发的库或者模块,非常好用,这里收集一些可能用到的第三方模块、官方网站和安装命令。注意你不需要安装所有的第三方库,用到哪个安装哪个就可以。
本文会持续更新,欢迎收藏。更多点击:Python学习日志目录
如果你也想学 Python 的话,可以关注微信公众号 逍遥乱弹,跟着我的 Python 学习笔记,相信你很快会入门的。有什么问题可以在相关文章下面留言,我看到了会及时回复的。
安装和卸载 Python 第三方库的命令
安装和卸载 Python 第三方库非常简单,只需要在命令行里输入下面命令就可以了,下面先看一下相关命令,后面会有演示。
安装第三方库的命令非常简单:
pip install 库名
如果是Mac或者Linux操作系统的话,是:
pip3 install 库名
下面都以Windows操作系统为例,其他系统把 pip 替换成 pip3 就可以了。
卸载第三方库:
pip uninstall 库名
查看安装了哪些第三方库:
pip list
升级 pip 的命令也非常简单,直接在命令行里输入:
如果你在运行这些命令的时候,提示下面橘色警告:
WARNING: You are using pip version 20.1.1; however, version 20.2.2 is available.
意思就是你的 pip 版本比较低,需要升级了。 升级 pip 的命令也非常简单,直接在命令行里输入:
pip install --upgrade pip
安装第三方模块或者库的时候,因为Python服务器在国外,所以有时候特别慢,所以可以使用国内的镜像。常用的Python国内镜像有:
豆瓣
https://pypi.douban.com/simple
阿里云
https://mirrors.aliyun.com/pypi/simple/
教育网可以使用一些知名大学的源:
清华大学的镜像
https://pypi.tuna.tsinghua.edu.cn/simple
中国科技大学的镜像
https://pypi.mirrors.ustc.edu.cn/simple
使用方法直接在pip命令后面空格加 -i https://pypi.douban.com/simple 就可以了,下面默认都加上了豆瓣的镜像,当然你也可以用同样的办法使用其他的镜像也是可以的。
pip install 库名 -i https://pypi.douban.com/simple
办公相关的第三方库
openpyxl 模块用来处理 Excel 表格(xlsx格式)
openpyxl官方文档:https://openpyxl.readthedocs.io/en/stable/
pip install openpyxl
如果安装失败,可以使用上面的第三方镜像,命令是这样的:
pip install openpyxl -i https://pypi.douban.com/simple
pypdf2 模块
可以读取、写入、分割、合并PDF文件
https://pythonhosted.org/PyPDF2/
pip install pypdf2 -i https://pypi.douban.com/simple
pdfplumber 模块
可以更好读取PDF内容
可以提取PDF中的表格
https://github.com/jsvine/pdfplumber
pip install pdfplumber -i https://pypi.douban.com/simple
python-docx 模块
可以创建和修改docx格式的Word文档
导入本模块跟名称不一样,直接导入docx
import docx
https://python-docx.readthedocs.io/en/latest/
pip install python-docx -i https://pypi.douban.com/simple
python-pptx 模块
可以创建和修改pptx格式的PPT文档
导入模块
import pptx
https://python-pptx.readthedocs.io/en/latest/
pip install python-pptx -i https://pypi.douban.com/simple
收发邮件相关的第三方库
yagmail 模块
全称 Yet Another Gmail/SMTP Client
一个非常方便的SMTP包,超简单的Python发邮件模块
https://github.com/kootenpv/yagmail
pip install yagmail -i https://pypi.douban.com/simple
imbox 模块
简易的Python IMAP包
进行IMAP收发邮件等相关操作
https://github.com/martinrusev/imbox
pip install imbox -i https://pypi.douban.com/simple
keyring 模块
从Python访问系统密钥环服务
方便、安全的存储你的密码
https://github.com/jaraco/keyring
pip install keyring -i https://pypi.douban.com/simple
schedule 模块
定时任务执行器
https://schedule.readthedocs.io/en/latest/
pip install schedule -i https://pypi.douban.com/simple
PS.多个库可以一次性安装,可以用像下面这样写,可以把上面提到的所有模块一次性安装了:
pip install openpyxl pypdf2 pdfplumber python-docx python-pptx yagmail imbox keyring schedule -i https://pypi.douban.com/simple
pip 版本升级
如果提示 pip 的版本比较老,比如上图黄色的字就是需要升级,可以用下面命令升级,同样可以加上豆瓣的镜像:
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
爬虫相关的第三方库
requests 模块
非常简单的爬虫利器
https://2.python-requests.org/en/master/
pip install requests -i https://pypi.douban.com/simple
Beautiful Soup 库
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。注意最新的版本是 BS4。
导入模块比较特殊:
from bs4 import BeautifulSoup
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
pip install beautifulsoup4 -i https://pypi.douban.com/simple
lxml 解析器
一个第三方HTML解析器,BS4 提取了数据之后,除了可以用 Python 标准库里的解析器之外,也可以使用 lxml 解析器,它的优点就是速度快,效率高,推荐使用。
pip install lxml -i https://pypi.douban.com/simple
html5lib 解析器
纯Python实现的 html5lib ,以浏览器的方式解析文档,容错最好,但是速度慢。
pip install html5lib -i https://pypi.douban.com/simple
同理,批量安装上面几个关于爬虫的库,可以用下面命令:
pip install requests beautifulsoup4 lxml html5lib -i https://pypi.douban.com/simple
Scrapy 框架
功能很强大的爬虫框架
https://docs.scrapy.org/en/latest/
https://scrapy-chs.readthedocs.io/zh_CN/latest/intro/overview.html
pip install scrapy -i https://pypi.douban.com/simple
不过很有可能会安装 Scrapy 失败。如果安装失败的话,有两个解决办法。
解决办法1:一般出现错误的都是 Twised 安装失败,提示:Running setup.py install for Twisted ... error
那么我们可以手动下载 Twisted 再安装。
下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
根据自己 Python 版本下载对应版本安装(如果你的Python是最新的,选择最新版就可以了)
然后命令行进入刚才这个文件的下载目录,然后运行下面命令进行安装。
pip install Twisted-19.10.0-cp38-cp38-win_amd64.whl
其中 Twisted-19.10.0-cp38-cp38-win_amd64.whl 是你下载的文件名。
成功安装Twisted之后,再运行pip命令安装 Scrapy,就可以安装成功了。
Selenium 库
Selenium 是一个用于 Web 应用程序测试的工具。
官方文档:https://selenium-python.readthedocs.io/index.html
pip install selenium -i https://pypi.douban.com/simple
使用 Selenium 需要下载 ChromeDriver,可以从淘宝提供的镜像里下载:
http://npm.taobao.org/mirrors/chromedriver/
PyQuery 解析器
也是对抓取的信息进行解析的工具
pip install pyquery -i https://pypi.douban.com/simples
数据分析相关第三方库
Numpy 模块
Numpy 是一个比较底层的数据分析模块,具有高性能、开源、数组运算、读取迅速等优势。
pip install numpy -i https://pypi.douban.com/simple
引入,一般我们引入的时候会给这个模块起一个别名 np
import numpy as np
Pandas 模块
Pandas 数据结构非常快速高效、数据处理功能比较智能、文件存储功能非常方便、科研和商业应用很广泛。
pip install pandas -i https://pypi.douban.com/simple
导入 Pandas 模块,同样起一个别名pd,方便后面使用
import pandas as pd
xlrd 模块
Pandas 可以使用 xlrd 模块来读写 Excel 文件(.xlsx)
pip install xlrd -i https://pypi.douban.com/simple
其他第三方库:
pip install IPython -i https://pypi.douban.com/simple pip install urllib3 -i https://pypi.douban.com/simple pip install jupyter -i https://pypi.douban.com/simple pip install matplotlib -i https://pypi.douban.com/simple pip install scipy -i https://pypi.douban.com/simple pip install scikit-learn -i https://pypi.douban.com/simple
关注我的公众号 逍遥乱弹,然后点击菜单 Python 就可以查看我所有的 Python 学习日志了。
后面我会继续分享 Python 基础知识,以及这些第三方库的使用。
下一篇:案例:Python os.listdir() 小练习
上一篇:Python 使用openpyxl模块编辑 Excel 表格
- 相关文章 -
Python 数字与数字型运算 - 2020-09-08
Python 基础知识之数据类型 - 2020-09-07
Python 学习中非常好用的编辑器 Sublime Text 3 - 2020-09-07
Python 基础知识之变量 - 2020-09-03
Python 详细安装步骤图解 - 2020-09-01
Python 数据分析模块 Pandas 之 DataFrame 数据 - 2020-02-09
Python 数据分析模块 Pandas 之 Series 数据 - 2020-02-05
Python 数据分析第三方库 Numpy 的安装和使用 - 2020-02-03
- 文章评论 -
- 最新评论[0条评论] -
版权所有©逍遥峡谷 - 星际中心超自然局 · 地球总部 |
逍遥峡谷 ·
酷品优选
Copyright©Interstellar Central Occult Agency (I.C.O.A)
本局纯属虚构,如有雷同,纯属巧合