文章詳情頁

python - 用sklearn求大文本的tfidf特征？

瀏覽：106日期：2022-06-27 15:50:07

問題描述

python - 用sklearn求大文本的tfidf特征？上面的數據是從reuters數據集中取得7303個訓練集，用sklearn對其取tfidf特征，得到的結果都是0，這是怎么回事？

當我從這些數據中取一部分時，對于這些少部分數據能夠得到正確的tfidf結果。 python - 用sklearn求大文本的tfidf特征？

python - 用sklearn求大文本的tfidf特征？

問題解答

回答1：

上代碼，可能是你精度太低或者min_count導致的

比如詞頻是1，總詞數1e9，對應的tf就是1e-9，被忽略了。

Python 編程

上一條：正則表達式 - 在python中怎么匹配IP地址下一條：python - Scrapy LOG信息輸出到文件

相關文章：

1. java - mongodb分片集群下，count和聚合統計問題2. javascript - vue 移動端的input 數字輸入優化3. java - 自己制作一個視頻播放器，遇到問題，用的是內置surfaceview類，具體看代碼！4. javascript - 有什么兼容性比較好的辦法來判斷瀏覽器窗口的類型？5. 服務器端 - 采用nginx做web服務器，C++開發應用程序出現拒絕連接請求？6. 為什么我ping不通我的docker容器呢？？？7. python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe8. 關于docker下的nginx壓力測試9. javascript - npm start 運行’webpack-dev-server’報錯 Cannot find module ’webpack’10. java 隨機延遲執行

排行榜

					
					javascript - vue 移動端的input 數字輸入優化
服務器端 - 采用nginx做web服務器，C++開發應用程序 出現拒絕連接請求？
java - 自己制作一個視頻播放器，遇到問題，用的是內置surfaceview類，具體看代碼！
javascript - 有什么兼容性比較好的辦法來判斷瀏覽器窗口的類型？
java - mongodb分片集群下，count和聚合統計問題
python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe
關于docker下的nginx壓力測試
為什么我ping不通我的docker容器呢？？？
java 隨機延遲執行
javascript - nidejs環境設置操作一直出現這種問題怎么解決？
javascript - npm start 運行’webpack-dev-server’報錯 Cannot find module ’webpack’
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - 用sklearn求大文本的tfidf特征？