亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術(shù)文章
文章詳情頁

javascript - nodejs抓取網(wǎng)站的翻頁判斷和言語判斷問題.

瀏覽:109日期:2023-09-14 08:12:31

問題描述

網(wǎng)址 http://www.everlight.com/news...兩個問題 1 : 怎么取得每頁的url2 是 點開新聞的內(nèi)容, 比如 http://www.everlight.com/news...如果是英文的操作系統(tǒng),顯示的是英語新聞,如果是中文系統(tǒng),則顯示中文新聞,我想在node里面固定抓取英文新聞,怎么處理.

問題解答

回答1:

問題關(guān)閉...

在post的時候,form里面有幾個關(guān)鍵性的數(shù)據(jù),是放在也沒的hidden變量里面,指定了這些變量應(yīng)該就能解決.

回答2:

右上角有個切換語言的,看一下代碼,是調(diào)用了這個函數(shù):function __doPostBack(eventTarget, eventArgument) {

if (!theForm.onsubmit || (theForm.onsubmit() != false)) { theForm.__EVENTTARGET.value = eventTarget; theForm.__EVENTARGUMENT.value = eventArgument; theForm.submit();}

}

其實就是提交了一下表單,而表單是有post的方式發(fā)送的原頁面所以,你點擊后會看到頁面有閃一下,但網(wǎng)址并沒有變化。所以,如果你要英文版的,post方式傳參數(shù):__EVENTTARGET='ctl00$ctl00$lBtnUSA'過去就可以獲得英文版的頁面。

獲取頁面內(nèi)的url,去解析dom就行了。

獲取頁面中的url的方法:

var jsdom = require('jsdom'); jsdom.env({ url: 'http://www.everlight.com/newsdetail.aspx?pcseq=4&cseq=7&seq=291', scripts: ['http://code.jquery.com/jquery.js'], done: function (err, window) { var $ = window.$; console.log('HN Links'); $('a').each(function() { //console.log(' -', $(this).text()); var tmp=$(this).text()+'---'+$(this).attr('href'); console.log(tmp); }); }});回答3:

這個還是分析一下request 中的header信息吧,里面有一項是可以利用設(shè)置語言的javascript - nodejs抓取網(wǎng)站的翻頁判斷和言語判斷問題.

標簽: JavaScript
相關(guān)文章:
主站蜘蛛池模板: a极毛片| 国产一区二区高清视频 | 久久久国产精品视频 | 欧美综合偷拍在线另类卡通小说 | 黄色一及| 麻豆传媒网站入口直接进入免费版 | 日本一级片网站 | 在线二区| 国产真实偷乱视频在线观看 | 91探花在线视频 | 亚洲综合图库 | 国产精品色午夜视频免费看 | 色婷婷影院在线视频免费播放 | 亚洲免费视频网 | 91原创视频在线 | 一区视频在线播放 | 午夜撸| 女人被狂躁视频免费版 | 一本久久精品一区二区 | 1000部未满岁18在线观看污 | 日韩大片在线观看 | 成人伊人 | 日韩视频不卡 | 日韩精品一区二区三区不卡 | 免费二级c片在线观看a | 欧美黄色免费看 | 久久亚洲欧美 | 国产精品主播 | 我要看欧美精品一级毛片 | 欧美洲久久日韩欧美 | 亚洲欧美日韩精品久久奇米色影视 | a一级爱做片免费 | 精品视频在线观看一区二区 | 成人午夜爽爽爽免费视频 | 国产午夜视频在线 | 全部免费特别黄的视频播放 | 亚洲综合网址 | 欧美三级成人 | 特黄十八岁大片 | 久久99国产精品二区不卡 | 亚洲人成影院午夜网站 |