文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:106日期:2022-06-27 15:50:07
問題描述
上面的數據是從reuters數據集中取得7303個訓練集,用sklearn對其取tfidf特征,得到的結果都是0,這是怎么回事?
當我從這些數據中取一部分時,對于這些少部分數據能夠得到正確的tfidf結果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導致的
比如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
相關文章:
1. java - mongodb分片集群下,count和聚合統計問題2. javascript - vue 移動端的input 數字輸入優化3. java - 自己制作一個視頻播放器,遇到問題,用的是內置surfaceview類,具體看代碼!4. javascript - 有什么兼容性比較好的辦法來判斷瀏覽器窗口的類型?5. 服務器端 - 采用nginx做web服務器,C++開發應用程序 出現拒絕連接請求?6. 為什么我ping不通我的docker容器呢???7. python - pandas按照列A和列B分組,將列C求平均數,怎樣才能生成一個列A,B,C的dataframe8. 關于docker下的nginx壓力測試9. javascript - npm start 運行’webpack-dev-server’報錯 Cannot find module ’webpack’10. java 隨機延遲執行
排行榜
