python實現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例
1、數(shù)據(jù)分組-->頻數(shù)分布表
環(huán)境配置:
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt
按照你設定合適的間隔,把數(shù)據(jù)分為各個范圍的組,然后統(tǒng)計出在這個范圍內(nèi)的頻數(shù)有多少,我沒有找到合適的函數(shù),我就自己寫了一個函數(shù),類似直方圖的工作,這是畫水平條形圖的數(shù)據(jù)準備。至于為什么要畫水平條形圖,當類別太多,使用水平條形圖比較簡潔,個人看法。下面給出代碼,就不解釋代碼含義了。
def data_count(dataa, r1, r2, step): r = pd.DataFrame(np.random.randn(1, 2)) r.drop(0, inplace=True) while r1+step <= r2: num = 0 for j in range(len(dataa)): if dataa[j] >= r1 and dataa[j] < r1+step: num = num + 1 f = '%s~%d' % (r1, r1+step) # r = r.append([[int(r1), num], ]) # 使用單數(shù)表示 r = r.append([[f, num], ]) # 使用范圍表示 r1 = r1 + step return r
要注意的數(shù)據(jù)范圍只包含上界不含下界,數(shù)據(jù)公式這樣子1⩽data<5,只含上界,這樣就可以做出不重不漏。
2、頻數(shù)計算
這是運用data_count函數(shù)(上面代碼)進行頻數(shù)計算的演示,首先看一下原數(shù)據(jù)長什么樣,暫時麻煩就不公布了,你們自己按照自己的數(shù)據(jù)決定。
測試data_count函數(shù)代碼:
data_gap1 = data_count(g11[:], 1, 51, 1)data_gap2 = data_count(g22[:], 1, 51, 1)
很簡單啦,就是函數(shù)的調(diào)用,你們都會的,給大家看一下輸出結(jié)果,如下圖:
輸出結(jié)果
感覺相當完美,函數(shù)也很萬能,只要輸入最小值最大值和間隔,就能出頻數(shù)分布表
3、水平條形圖
def plot_bar(plot_data, title): plt.figure(figsize=(10, 15)) y = plot_data.iloc[:, 1].values tt = list(range(len(y))) index = plot_data.iloc[:, 0].values plt.bar(left=0, bottom=list(range(len(y))), width=y, color=’blue’, height=0.5, orientation=’horizontal’) # 水平對應bottom&width, height表示bar的寬度 plt.yticks(tt, index) plt.ylabel(’數(shù)據(jù)范圍’) plt.xlabel(’頻數(shù)’) plt.title(title) plt.show()
上面中plt.bar(left=0, bottom=list(range(len(y))), width=y, color=’blue’, height=0.5,orientation=’horizontal’)這句代碼是最重要的,其中l(wèi)eft表示直方圖的開始的位置(也就是最左邊的地方),height是指直方圖的高度,當直方圖太粗時,可以通過width來定義直方圖的寬度,注意多個直方圖要用元組,yerr這個參數(shù)是防止直方圖觸頂。orientation=’horizontal’指得水平條形圖,使用barh方法可以省略這個參數(shù)得設定。
有個坑,如果直接用bottom=類別數(shù)據(jù),文本格式的類別會亂序,需要像我那樣先指定位置,在指定類別,如plt.yticks(tt, index)所作的工作。
水平條形圖
補充知識:在ipython notebook中添加latex公式
1 MathJax 的安裝
ipython notebook中數(shù)學公式的渲染使用MathJax。一般網(wǎng)絡較好的情況下,MathJax可以在線使用,但是如果希望離線使用,需要將其安裝到本地磁盤中,常用的方法是在ipython notebook中使用以下命令:
from IPython.external.mathjax import install_mathjax
install_mathjax()
2.生成配置文件
安裝完mathjax之后可以正常import latex,但是執(zhí)行Latex(r’Ssqrt{x^2+y^2}$’)后顯示的是‘$sqrt{x^2+y^2}$’這樣字符串;
原來還需要生成配置文件,方法是:在命令行中運行 ipython profile create,執(zhí)行完成會在./ipython/profile_default 目錄下生成
一系列的配置文件,其中包括ipython_notebook_config.py文件;有地方看到需要修改該配置文件,取消 c.NotebookApp.enable_mathjax=True;
的注釋,大家可以試一下,我自己沒有取消這行注釋,再打開ipnb文件時公式都能正常渲染,耶~
第一次記錄blog,一方面跟大家一起學習,一方面方便以后回顧,畢竟記性差了許多,哈哈~
以上這篇python實現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. Ajax實現(xiàn)表格中信息不刷新頁面進行更新數(shù)據(jù)2. 詳解CSS偽元素的妙用單標簽之美3. python 實用工具狀態(tài)機transitions4. PHP 面向?qū)ο蟪绦蛟O計之類屬性與類常量實現(xiàn)方法分析5. UDDI FAQs6. msxml3.dll 錯誤 800c0019 系統(tǒng)錯誤:-2146697191解決方法7. HTML <!DOCTYPE> 標簽8. Java Spring WEB應用實例化如何實現(xiàn)9. CSS自定義滾動條樣式案例詳解10. 將properties文件的配置設置為整個Web應用的全局變量實現(xiàn)方法
