亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Java爬蟲已獲取圖片鏈接但是無法下載圖片

瀏覽:86日期:2023-12-10 14:58:56

問題描述

利用爬蟲在html中獲取的相應圖片資源src的代碼是這樣的

網頁爬蟲 - Java爬蟲已獲取圖片鏈接但是無法下載圖片

但是再通過代碼將資源轉成鏈接的形式下載圖片的時候,就報了400的錯誤

網頁爬蟲 - Java爬蟲已獲取圖片鏈接但是無法下載圖片

然而,我使用chrome去測試鏈接是否存在是,發現,真正對方網站服務器能夠識別的是

網頁爬蟲 - Java爬蟲已獲取圖片鏈接但是無法下載圖片

也就是說我通過網頁獲得圖片資源的鏈接是http://www.neofactory.co.jp/i... 2.jpg然而,正常能夠獲取圖片的鏈接是http://www.neofactory.co.jp/i...

請各位大神指導之后應該怎么辦,我在網上查了好多資料,還是沒有解決辦法。ps:奇怪的是我用Firefox的話,上面的那個鏈接也能得到圖片,我就百思不得其解了。

代碼:

public class Image {

private String urlNeo='';public String getUrlNeo() { return urlNeo;}public void setUrlNeo(String urlNeo) { this.urlNeo = urlNeo;}public String getHtml() throws Exception{ ArrayList<String> list=new ArrayList<String>();String line=''; String Html=''; URL url=new URL(urlNeo); URLConnection connection=url.openConnection(); InputStream in=connection.getInputStream(); InputStreamReader isr=new InputStreamReader(in); BufferedReader br=new BufferedReader(isr); while((line=br.readLine())!=null){Html+=line;list.add(line); } br.close(); isr.close(); in.close(); return Html;}public String getImgSrc() throws Exception{ String html=getHtml(); String IMGURL_REG_xpath='//p[1]/p[2]/p[2]/p/node()'; String imginfomation=''; JXDocument jxDocument = new JXDocument(html); imginfomation=(jxDocument.sel(IMGURL_REG_xpath).toString()).substring(1,jxDocument.sel(IMGURL_REG_xpath).toString().length() - 1); return imginfomation;}public List<String> getImgXpath() throws Exception{ String str=''; String IMGSRC_REG = 'img.product.w.*.jpg'; List<String> list1=new ArrayList<String>(); List<String> list2=new ArrayList<String>(); String listimg = getImgSrc(); Matcher matcher = Pattern.compile(IMGSRC_REG).matcher(listimg); while (matcher.find()) {list1.add(matcher.group()); } for(int i=1;i<=(list1.size()/2);i++){int j=i*2;list2.add(list1.get(j-1)); } return list2;}public void download(String admin_no) throws Exception{ List<String> list=new ArrayList<String>(); list=getImgXpath(); for(String img:list){System.out.println(img);String url='http://www.neofactory.co.jp/'+img;URL uri=new URL(url);URLConnection con=uri.openConnection();con.setConnectTimeout(5000);InputStream in=con.getInputStream();byte[] buf=new byte[1024];int length=0; File sf=new File('D:item_neo_photo'+admin_no);if(!sf.exists()){ sf.mkdirs();}String[] a=img.split('/');OutputStream os=new FileOutputStream(sf.getPath()+''+a[a.length-1]);while((length=in.read(buf))!=-1){ os.write(buf, 0, length);}os.close();in.close(); }}

}

問題解答

回答1:

直接把域名+獲取的img src屬性拼起來不行么

回答2:

url編碼下

標簽: java
相關文章:
主站蜘蛛池模板: 好吊色青青青国产欧美日韩 | 成年片免费网址网站 | 黄色欧美一级片 | 全部免费国产潢色一级 | 最刺激黄a大片免费观看 | 欧美 日韩 国产 成人 在线观看 | 国产日韩精品欧美一区视频 | 国内精品久久久久影院嫩草 | 999yy成年在线视频免费看 | 亚欧洲精品在线视频免费观看 | 免费黄色a视频 | 国产欧美日韩一区二区三区 | 加勒比一本大道香蕉在线视频 | 亚洲精品久久青草 | 免费在线观看污片 | 久久亚洲人成网站 | 18到20岁女人毛片一区 | 成年男女男精品免费视频网站 | 亚洲视频一区二区 | 亚洲欧美国产精品第1页 | 香蕉视频在线视频 | 国产精品日本欧美一区二区 | 泰国午夜理伦三级在线观看 | 欧美在线精品一区二区在线观看 | 国产精品馆 | 久久精品韩国三级 | 农村寡妇一级毛片免费播放 | 黄色三级在线 | 97超级碰碰碰碰在线视频 | 久久这里只有精品66re99 | 国产精品自拍在线观看 | 4444亚洲国产成人精品 | 综合精品在线 | 日韩视频www | 久久天堂夜夜一本婷婷麻豆 | 亚洲黄色网址在线观看 | 俄罗斯小屁孩cao大人免费 | 日本xxxⅹ色视频在线观看网站 | 亚洲欧美日韩精品高清 | 国产午夜毛片一区二区三区 | 成年人视频网站免费 |