很多时候我们会看到像如图这样的词语组成的图片,这就是词云图。词云以词语为基本单位,更加直观和艺术的展示。wordcloud是优秀的词云展示的第三方库,我们可以借助wordcloud轻松实现词云图。使用Wordcloud之前需要先了解它的以下几个特点:在wordcloud库把词云当作一个wordcloud对象根据文本中词语出现的次数绘制词云支持自定义设置词云的 ......
285
0
0
2024-01-05
数据经过NumPy和Pandas的计算,最终得到了我们想要的数据结论,但是这些数据结论并不直观,所以想要把数据分析的结论做到可视化,让任何其他人看起来毫无压力,那么Matplotlib将派上用场。Matplotlib简介Matplotlib是一个Python全面的绘图库,用于创建静态、动画和交互式可视化。通过 Matplotlib,我们可以仅需要写几行代码, ......
230
0
0
2024-01-05
Pandas是一个强大的分析结构化数据的工具集,它的使用基础是Numpy,用于数据挖掘和数据分析,同时也具有数据清洗功能。Pandas简介Pandas也是Python数据分析和实战的必备工具包之一,它提供了快速灵活的数据结构,简单的直观的处理关系型数据。可以方便的处理像Excel或者数据库中这样的结构化的数据。Pandas是基于NumPy开发,并且是开源的分 ......
203
0
0
2024-01-05
接着之前的Python基础知识更新,这块内容很久之前就写了一版,但是后面也没有仔细修改,现在趁着这个机会在顺一遍。前文中,主要写了一些数据采集和数据储存内容,那么最终我们把需要把数据的内容提取出有价值的观点以及更通俗易懂的表达方式,就是最后一步的数据分析和可视化。数据分析是对数据进行详细研究以及概括总结从而提炼出数据中的有用信息行成结论的过程。下面的这部分章 ......
219
0
0
2024-01-05
前文中说到,数据分析就是像是做饭一样,在数据获取的内容好比收集食材,通常情况下,食材装备好后是需要有容器存放,有一些是需要立马做饭使用的,就放在盆中,还有一些今天用不上,下次需要的先放到冰箱中。同样,数据也是如此,尤其是爬虫获取的数据,通常是需要保存到本地中,方便下次直接使用。所以数据存储也是数据分析重要的一环,通常情况下,数据量少的时候多数使用本地文件,比 ......
246
0
0
2024-01-05
前面初步学习requests库、了解基本HTML的内容和解析页面常用的lxml、Beautiful Soup模块的内容,下面我们就可以使用这些内容在互联网上爬取一些数据,为下一步的数据分析提供原材料。写好一个爬虫最基本的是做好页面分析,找到链接和规律,这样在写爬虫的时候就可以有方向和目的性。接下来,我们就以爬虫最常用的豆瓣评分TOP250的内容作为爬虫的de ......
225
0
0
2024-01-05
在上一节中,认识了Python中的lxml库,可以通过XPath来寻找页面中的位置,这也是仅仅对于结构完整的页面,但是对于有针对性的获取内容的时候并不很友好,比如说链接中以XXX开头或者结尾,而且中间符合某些特定规则,所以这时候需要认识一个新朋友,那就是另外一个很强大的解析库——Beautiful Soup。与 lxml 一样,Beautiful Soup ......
223
0
0
2024-01-05
目录一、前言二、图像处理下面为常见的图像变换1.原始图片2.调整图片大小transforms.Resize2.1.transforms.Resize(x)2.2.transforms.Resize([x, y])2.3关于图片的恢复3.图片裁剪3.1中心裁剪transforms.CenterCrop3.2随机裁剪transforms.RandomCrop(s ......
365
0
0
2023-09-16
【51CTO.com原创稿件】 RPC (Remote Procedure Call):远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的思想。 RPC 是一种技术思想而非一种规范或协议,常见 RPC 技术和框架有:应用级的服务框架:阿里的 Dubbo /Dubbox、Google gRPC、Spring Boot/Spri ......
317
0
0
2023-09-15
目录1. 如何使用 Asyncio 检查 HTTP 状态2. 打开 HTTP 连接3. 写入 HTTP 请求4. 读取 HTTP 响应5. 关闭 HTTP 连接6. 顺序检查 HTTP 状态的示例7. 并发查看网站状态示例我们可以通过打开流并写入和读取 HTTP 请求和响应来使用 asyncio 查询网站的 HTTP 状态。然后我们可以使用 asyncio ......
298
0
0
2023-09-11
目录前言需求多线程守护线程:在 Python 线程中引发异常signal.pthread_kill操作:多进程多协程结语前言python使用中多线程、多进程、多协程使用是比较常见的。那么如果在多线程等的使用,我们这个时候我们想从外部强制杀掉该线程请问如何操作?需求在python多线程等的使用中,我们需要在外部强制终止线程,这个时候又没有unix的pthrea ......
383
0
0
2023-09-11
目录NumPy包中的数据结构数组(Ndarray)创建NdarrayNdarray查询操作Ndarray增加操作Ndarray 删除操作Ndarray修改Ndarray其它操作Ndarray转化成其它数据结构矩阵(Matrix)创建MatrixMatrix查询操作Matrix增加操作Matrix删除操作Matrix特殊操作Matrix转换为其它数据结构序列( ......
313
0
0
2023-09-10
目录1.url encode加密2.unicode 加密3.Base64 加密4.MD55.PBKDF26.SHA7.HMAC8.DES9.3DES10.AES11.RC412.Rabbit13.RSA1.url encode加密简介:当url地址含有中文,或者参数有中文的时候,这个算是很正常了,但是把这样的url作为参数传递的时候(最常见的callback ......
436
0
0
2023-09-10
目录删除字符后的所有内容,保留分隔符删除最后一次出现的字符后的所有内容删除最后一次出现后的所有内容,保留分隔符使用 str.partition() 删除字符后的所有内容在 Python 中删除字符串中字符之前的所有内容处理角色不存在的场景删除最后一次出现的字符之前的所有内容使用 rsplit() 删除字符最后一次出现之前的所有内容使用 rpartition( ......
300
0
0
2023-09-10
目录1.概述2.常见用法2.1.显示格式2.2.写入文件2.3.json日志2.4.日志绕接2.5.并发安全3.高级用法3.1.接管标准日志logging3.2.输出日志到网络服务器3.3.与pytest结合附录1.概述python中的日志库logging使用起来有点像log4j,但配置通常比较复杂,构建日志服务器时也不是方便。标准库logging的替代品是 ......
317
0
0
2023-09-08