文章詳情頁
python - 對大面積空值的數(shù)據(jù)預(yù)處理是怎么進行的?
瀏覽:93日期:2022-07-16 18:28:14
問題描述
對于缺失值基本有刪除、填充和重構(gòu)變量等做法,但是具體的操作是怎么進行的呢?比方說你當(dāng)你并不清楚各個字段的含義時:
1.如何認定該字段與模型無關(guān)、缺失值的比例達到多少就可以刪除?
2.什么時候會認為缺失值也是一種有用的狀態(tài)?
3.什么時候需要進行數(shù)據(jù)填充?
問題解答
回答1:方法還是挺多的。我找到幾個鏈接,附在下面,應(yīng)該對你有幫助。
訓(xùn)練集中有的特征含有缺失值,一般怎么處理如何判斷缺失值是否是隨機的缺失?
回答2:請問怎麼用。
相關(guān)文章:
1. 編程小白 問關(guān)于python當(dāng)中類的方法的參數(shù)問題2. html的qq快捷登錄怎么搞?求個源碼3. linux - python -m參數(shù)4. (JAVA)最近在做到支付寶的一碼多付支付接口,發(fā)現(xiàn)沒有異步回調(diào)通知,需要自己輪詢查詢訂單狀態(tài),這個需要怎么實現(xiàn)?5. python中def定義的函數(shù)加括號和不加括號的區(qū)別?6. pip安裝提示Twisted錯誤問題(Python3.6.4安裝Twisted錯誤)7. mysql - 求SQL語句:查詢某個值介于兩個字段值之間的記錄。8. mysql - 分庫分表、分區(qū)、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處9. mysql - select查詢多個紀錄的條件怎么寫10. python - 有哪些預(yù)測算法可以根據(jù)實時增量數(shù)據(jù)更新算法并預(yù)測后續(xù)數(shù)據(jù)?
排行榜

熱門標簽