哪些Python库让你相见恨晚?
哪些Python库让你相见恨晚?
-----
网友解答:
-----
Python能取得如此巨大的成功,除了其语法简洁外,很大程度上在于它拥有
超级多的原生库以及第三方库
,注意这里我用到了
超级多
这个词......
下面谈谈自己“相逢恨晚”的库,排名不分先后,涉及到网络下载、爬虫、数据可视化、时间转换、SQL注入等,限于篇幅,类似TensorFlow(机器学习方向)、scrapy (爬虫方向)等等优秀的库并未介绍,欢迎大家留言补充。
You-Get
一款优秀的网站视频下载工具,使用它你可以简单的通过一条命令行工具完成视频、音频、图片等媒体资源的下载(即使这些网站没有提供)下载链接,比如YouTube、爱奇艺、腾讯视频、哔哩哔哩等。
注意:支持的Python版本为Python3.2+,安装过程只需简单的一条pip命令即可。
Requests
相信很多搞爬虫的朋友都会用到这个库,我们先来看看官方对它的介绍:
Requests is an elegant and simple HTTP library for Python, built for human beings.
比urllib更加方便,可以节约我们大量的工作,而且专门为英文不太好的朋友提供了中文官方文档。下面是使用requests库后简洁明了的HTTP请求代码。
wget
相信经常玩Linux的朋友,一定知道Shell中一个很好用的下载工具:wget,可以很方便的下载网上资源。
其实Python中也有对应的模块——Wget,它可以很方便的帮助我们递归下载一个网站,甚至爬取页面的所有图片,甚至在电影《社交网络》里连马克·扎克伯格(全球知名的社交网站Facebook创始人之一)都说:
首先是 Kirkland,它们开放了所有的东西,并允许在Apache里插入索引。所以用
WGET
就足以下载整个Kirkland的Facebook图片了。小菜一碟!
pyecharts
pyecharts = Python + Echarts
很多玩前端的朋友应该都听说过百度开源的一个数据可视化JS库Echarts,当 Python 遇到了Echarts,就变成了pyecharts。通过简单的几行代码,我们就可以完成强大、颜值高的可视化效果图。
说再多不如代码来的实际,通过上面剪短的10行(去掉注释、空行)代码,就可以完成如下图所示的柱状分布图。
Delorean
一个酷炫的日期时间库,类似JavaScript中的moment,它可以让你用更加简洁的代码解决Python中使用时间模块中遇到的问题,比如转换、操控和生成时间日期。
在没有使用Delorean之前,也许我们的代码是下面这个样子
使用它之后呢?像下面这样,有没有很香呢?
sqlmap
是一款用来检测与利用SQL注入漏洞的免费开源工具,支持所有类型数据库的注入。也许就连很多专业的Python开发者都不曾用过,不过,在网络世界的另一角,白帽子、黑客、网络安全爱好者心中,它简直是神一般的存在。
作为一名网络安全从业者,如果你不仅能熟练使用sqlmap这种牛逼的工具,甚至还读过几遍源码,还能修改,那么还怕写不出sql注入的POC吗?
本文为作者“一个程序员的奋斗史”悟空问答原创文章,未经允许转载、抄袭必究!
-----
网友解答:
-----
这个就非常多啦,下面我简单介绍几个非常不错的Python库,感兴趣的朋友可以尝试一下:
01
tensorflow
这是谷歌一个非常著名的开源机器学习框架,在业界非常流行,社区资料丰富,
接口
文档全面,能随时随地构建可靠的机器学习模型,快速验证算法有效性,如果你是一个科研人员或工程人员,那么tensorflow就是一个非常不错的辅助工具,值得学习和使用:
02
pandas
这是Python一个非常著名的数据处理库,在业界非常受欢迎,内置了大量函数和类型,可以轻松处理各种文件,包括常见的Excel,CSV,Txt,Json等,代码量更少,功能也更强大,如果你需要进行复杂的数据处理,那么pandas就是一个非常不错的选择:
03
tushare
这是Python一个非常不错的财经金融库,免费、开源,集成了股票等金融数据从采集、清洗、加工到存储的全过程,极大的减轻了金融分析人员的工作量,如果你对金融股票等数据感兴趣,想快速获取到想要的信息,那么tushare就是一个非常不错的选择:
04
scrapy
这是Python一个非常著名的爬虫框架,在爬虫界非常受欢迎,免费、开源、跨平台,可定制化程度非常高,只需编写少量代码就可快速启动一个爬虫程序,相比较requests等轻型爬虫库,代码更简洁,效率更高,如果经常需要采集网页数据,那么scrapy就是一个非常不错的选择:
05
you-get
这是Python一个非常不错的视频下载工具,免费、开源、跨平台,可以快速下载B站、优酷、美拍等网站视频(图片、音频也可下载),支持在线播放、批量下载,如果你经常需要下载网页视频,缺少一个轻便灵活的下载工具,那么you-get就是一个非常不错的选择,当然,youtube-dl也非常不错:
目前,就分享这5个非常不错的Python库吧,对于日常学习和办公来说,非常有用,只要你熟悉一下使用过程,很快就能掌握的,当然,还有许多其他库,像Matplotlib,Django,Scikit-learn等也都非常不错,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。
-----
网友解答:
-----
列举几个Python库吧,希望对你有所帮助。
1.日志库
安装方法:
pip install loguru
最简单的使用方法:
from loguru import logger
logger.debug(\"That's it, beautiful and simple logging!\")
有兴趣也可以看看我之前制作的视频:https:www.ixigua.com6839340605517070852
2.时间处理库
安装方法:
pip install -U arrow
最简单的使用方法:
>>> import arrow
>>> now_time = arrow.now()
>>> now_time.timestamp
1368303838
有兴趣也可以看看我之前制作的视频:https:www.ixigua.com6840103612434088462
3.冷门的正则表达式库,不用懂正则也可以提取字符串。
安装方法:
pip install parse
最简单的使用:
>>> from parse import *
>>> parse(\"It's {}, I love it!\", \"It's spam, I love it!\")
<Result ('spam',) {}>
>>> _[0]
'spam'
有兴趣也可以看看我之前制作的视频:https:www.ixigua.com6875288541958504975
如果你觉得这几个库都不好用,那我就不用介绍其他了。
如果感兴趣,可以
关注
@
testerzhang
,不定期发布一些相关技术文章和视频。
-----
网友解答:
-----
很高兴能够看到和回答这个问题!
Python中的模块其实就是Python文件,在文件中可以定义多个类、函数、变量等。正常情况下,同一文件中的代码具有较高的连贯性,不同文件之间的代码是低耦合的,不同文件之间的代码可以相互调用,使得代码可以多次使用。
模块:
通过import Sys导入模块。如果找不到文件,会显示变量的路径值。通过Sys. 浏览搜索目录的路径,通常包含当前目录、Python目录等,并在目录列表中定义搜索顺序(通常为当前优先级)。
如果默认的搜索目录中没有指定访问模块,则必须手动将其添加到搜索目录中。如果多个模块包含相同的内容,可以在访问时指定模块的名称。
如果访问模块没有在默认的搜索目录中指定,则必须手动将其添加到搜索目录中。如果多个模块包含相同的内容,可以在调用时指定模块名称。内容会有所不同,否则根据导入顺序,会导入最后一个模块。
时间库
时间模块根据日期和时间提供不同的类和函数。时间的表达方式通常有三种:施工时间、字体时间、行时间。这三种形式可以在具体函数之间进行转换。当字符串转换为基本时间时,除了需要分析具体的百分比外,还必须在原文中输入其他地方,如空格、对角线、冒号等,否则无法找到匹配。
集群扩展到Python容器:dict、list、set、元组等,并提供一些具有特殊功能的子类。例如,反向、逆向、逆向等。
Defaultdict库
是dict dictionary的一个子类。它支持字典中的所有默认值,用来默认字典中不存在的所有键,而不是只报错。
NumPy库
在Python接口中使用高速包C,而Cython则使用额外的类型来编译Python C,以提高性能。然而,Numba无疑是最方便的,因为它允许装饰者选择加速Python函数。为了进一步提高速度,您可以使用Python标准应用程序来兼容工作负载、SIMD或GPU命令。注意:NumPy可以和Numba一起使用。毕竟NumPy有很多成熟的算法,不需要从头开始应用。不过,对于小算法,NumPy在很多情况下比NumPy高很多倍。
OpenPyxl的工作是修改Excel文件,而不是直接控制Excel。使用Openpycl,你可以自动创建电子表格和工作簿,创建公式,用这些公式填充单元格,并执行许多其他操作。你还可以改变Excel对象的属性,如格式和单元格条件。
以上便是我的一些见解和回答,可能不能如您所愿,但我真心希望能够对您有所帮助!不清楚的地方您还可以关注我的头条号“每日精彩科技”我将竭尽所知帮助您!
码字不易,感觉写的还行的话,还请点个赞哦!
-----
网友解答:
-----
这里我推荐下 python 的 seaborn 库,主要用于数据可视化,使用起来非常简单。
下面演示下简单用法,假设已经安装python包和环境管理工具conda.
# 创建环境
conda create -n visualization python=3.9 matplotlib seaborn
# 导入包
# importing packages
import seaborn as sns
import matplotlib.pyplot as plt
# 载入数据
# loading dataset
data = sns.load_dataset(\"iris\")
# 画图并显示
sns.pairplot(data=data, hue='species')
plt.show()
效果如下图所示,
下面是 seaborn 官网的应用示例,参考下。
-----
网友解答:
-----
Python要想玩的转,关键是要看你对它所涉及到的库的运用!除了人工智能和大数据相关的库以外,主要介绍几个有趣好玩的库!
PyGame
PyGame库,可以用它来开发一些简单的游戏,基于PySDL(Python版SDL),该框架完全简化游戏开发流程以达到快速开发的效果。记得刚开始学习Python的时候,基础部分结束后有一个小项目,就是写一个简单的游戏,用的就是这个库。后来对它是好感倍增!PyGame恰巧门槛低,能让你快速开发出属于自己的游戏。既简单又好玩!6
Pillow
pillow是Python的图像处理库,也工作中常用到的,我们一般叫它PIL,PIL经常被用作图片处理、屏幕抓图,GIF图制作等操作。如果你还在头疼怎么制作一款有关图片操作处理的软件,不妨去学习下PIL,相信它一定不会让你失望。当然PIL也用在人工智能的图像识别上!目前运用较多
Selenium
Selenium是一款浏览器自动化测试框架,主要是用来测试Web项目和网页游戏自动化辅助,还可以运行JavaScript代码。如果你想对一个网页做一些操作比如点击某个按钮,或者是填写表单,再者网页游戏签到等等,就可以用它来完成,是不是很神奇!
Scrapy
Scrapy是一个相当强力的库,也是黑客必备的一个库!通过它写爬虫程序就可以爬取其他公司数据,也称作盗取数据!对黑客感兴趣的同学可以学学这个库!它还有一个功能可以让开发者无需浏览器就可以浏览网站。
Python有很强大的库,这也是它如此火的一个原因。像这样的库还有很多比如Asciimatics用来构建命令行图形,并开发出命令行动画效果。PyInstaller可执行文件构建工具,兼容性更好,更实用。Scapy主要用来发送、侦听和解析报文。Requests可以实现web服务器和客户端浏览器之间的数据交互,也受黑客青睐!PyOgre可以用来做任何3D渲染,游戏,媒体,模拟等等。
要想了接更多的可以关注我,欢迎留言讨论!
-----
网友解答:
-----
谈到 Python中相见恨晚的第三方模库,我想应该是一些能够颠覆自己之前代码实现的库,在支持功能、代码设计简洁方面有着非常突出的优势。很开心,在上半年遇到这样的一个Python第三方库——
pandas-profiling
。这是一个对数据集进行探索性数据分析(Exploratory data analysis)的库,我们先来看下它能做什么,如下:
我们可以看到它输出了包含了各个维度的探索性数据分析统计结果,而关键的是
pandas-profiling 仅用三行代码
就输出了如上的所有数据分析统计结果——
强无敌
。
接下来,我们来认识一下Python
pandas-profiling
库。
较以往
我们使用 Pandas进行数据分析时,首先要对数据集进行探索性数据分析,以便对数据集有一个大体的了解,明确后续数据预处理、分析方向。数据EDA大致包含如下内容:
感知数据直观表现
挖掘潜在结构
提取重要变量
处理异常值
检验统计假设
建立初步模型
决定最优因子的设置
以往,我们首先会使用
pandas.describe
方法,对数据集可以有个大体的了解,如下:
我们使用
pandas.describe
可以看到如下 数据量、平均值、标准值、最小值等信息。
当然这些信息对于我们数据集探索还这远远不够,然后我们会再通过分析数据各维之间的关系,如使用折线图,散点图,关联分析等等,进一步探索数据集。
不难发现,我们要完成数据EDA操作,通常需要连续的若干步骤的操作,比较繁琐。
相见恨晚
直到看到了pandas-profiling项目,其使用
df.profile_report
扩展了
Pandas DataFrame
,实现了一行代码就可以生成一份超详细的数据分析报告,强无敌!
报告中包含以下关键信息:
概要:类型、惟一值、缺失值。
分位数统计:如最小值,较小四分位数,中位数,较大四分位数。
描述性统计:均值、标准差和中位数绝对偏差、变异系数、峰度、偏度。
相关性:突出高度相关的变量,斯皮尔曼,皮尔逊和肯德尔矩阵。
缺失值:矩阵、计数、热图和树状图的缺失值。
下面,我们以泰坦尼克号数据集为例,来一起体验一下
pandas_profiling
的强大。代码十分简洁,如下:
执行上述代码,就会生成我们开头Gif动图中的html文件,为了方便我们更清楚的看到html中的内容,我们截图了其中部分内容的截图,如下:
-----
网友解答:
-----
刚发布不久的易函数,完整的封装了易语言核心支持库所有功能,以及易语言中简单易用的函数
-----
网友解答:
-----
随便举几个,scrapy 爬虫 requests 爬虫 selenium web自动化操作和测试,也可以当爬虫来用 beautifulsoup web页面解析 sklearn机器学习 pandas, numpy数据操作Django web开发框架,还有一个zzzz是我自己写的[捂脸]
-----
网友解答:
-----
sqlmap确实强大,我做渗透测试注入测试时也用,这个应该算软件,而不是库吧。
-----
网友解答:
-----
个人认为tkinter这个库很有魅力,这个库主要与GUI有关,对于我这种刚入门级别的小白来说,这让我感受到了Python这门语言的强大。
Python内置的库很多,而且还可以后期安装与你的Python版本适配的库,这让你更加高效快捷达到你的开发目的。
比如后期安装的BeautifulSoup用于爬虫,在网页上抓取数据,使用起来比较容易理解。
还有pillow这个库用来处理Python与图片有关的操作,功能很强大。
------------------
推荐阅读:
素来有鱼米之乡之称的江南,唐宋元明清几个大朝代咋不定都江南?