基于python實現檢索標記敏感詞并輸出
一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用于產品的宣傳,可以使用程序檢測敏感詞,以下既是具體代碼。
#檢索敏感詞并描紅輸出#輸入word = input('請輸入或拷貝含有敏感詞的宣傳文字:')#敏感詞庫sensitive = [’第一’,’國家級’,’最高級’,’最佳’,’獨一無二’,’一流’,’僅此一次’,’頂級’, ’頂尖’,’尖端’,’極品’,’極佳’,’絕佳’,’絕對’,’終極’,’極致’,’首個’,’首選’, ’獨家’,’首發’,’首次’]#在輸入語句中發現的敏感詞,放在列表中sensitive_find = []#newword用于標紅敏感詞,word用于循環newword = word#遍歷敏感詞庫for item in sensitive: #將至少出現一次的敏感詞放到sensitive_find中,然后標紅 if word.count(item)>0: sensitive_find.append(item+’:’+str(word.count(item))+’次’) #newword存放標紅后的整段話,word則不變 newword = newword.replace(item,’ 033[1;31m’+item+’033[0m’)print(’發現敏感詞如下:’)for item in sensitive_find: print(item)print(’敏感詞位置已用星號進行標注:n’+newword)
結果(ps結果中有標紅的部分,這里未顯示,下面用部分截圖說明一下):
請輸入或拷貝含有敏感詞的宣傳文字:天貓首發,耀世登場,世界品質,慶偉制造。本產品目前是同類產品中最高級的。2018年全網銷售量第一,瑤瑤領先同類產品。國內外頂級大師鼎力支持,是您居家生活的唯一選擇。發現敏感詞如下:第一:1次最高級:1次頂級:1次首發:1次敏感詞位置已用星號進行標注:天貓 首發,耀世登場,世界品質,慶偉制造。本產品目前是同類產品中 最高級的。2018年全網銷售量 第一,瑤瑤領先同類產品。國內外 頂級大師鼎力支持,是您居家生活的唯一選擇。
有標紅部分的截圖
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。
相關文章:
