大家好,在三月初,我曾給大家分享過一份Matplotlib繪圖小抄:《Matplotlib cheat sheet:一圖搞定Matplotlib!》
昨天在面向GitHub編程時,無意發現了Pandas官方竟提供了同款小抄,項目地址如下
http://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf
可以看到這份小抄提供了PPT和PDF兩個版本,雖然最新一條更新記錄為兩年前,但是并不影響我們拿來學習,下面我們來看看這份小抄(速查表) 的強大!
這份速查表一共有兩頁,我已經將它轉換為圖片👇發在公眾號可能會被壓縮,你可以在文末下載高清大圖
經過一番研究,這兩張圖片一共覆蓋了12個常用的Pandas操作👇
1、數據創建
介紹了幾種常用的DataFrame創建語法
2、數據重塑
這部分主要是一些在數據清洗中常用的方法,比如數據連接、數據排序、數據刪除等,并且還對四個常用的操作給出了圖示,理解起來簡直不要太方便!
3、數據篩選
這一塊區域主要是分別用行/列來講解一些常用的數據查看、抽樣、切片等操作,包含了tail
、head
、loc
、iloc
等非常重要的方法,并且同樣給出了部分動畫便于理解
4、數據探索
這一塊主要給出了一些在進行探索性分析時常用的方法,比如max
、min
、count
等,不過官方將apply放在這里,并沒有展開講解
5、數據修改
這兩個區域為缺失值處理和創建新的列,重點用動畫示例了assign
和qcut
方法,缺失值處理部分僅給出了兩個方法,應該是偷懶了
6、數據分組
主要就是groupby
和相關方法
7、數據連接
這里介紹的還是非常詳細!用圖片例子來展示pd.merge
中的各種參數變化的不同,一看就懂
以上就是我對這份小抄的基本概括,其實大家應該清楚,僅僅靠靠兩張圖片根本沒法把整個Pandas學明白,所以官方也有選擇性的對一些重要的方法給出了詳細的講解,而有些功能則一筆帶過,比如我之前👉僅給出了區區一角
所以你應該這樣用這份小抄,把它當成速查表,「用于了解哪些操作可以用Pandas完成」,在你不確定或者不明白如何處理數據時,通過這份速查表快速查到Pandas中的哪個方法可以完成,之后再進一步通過搜索學習對應的方法!
好了,以上就是本文全部內容。