亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

Java 根據(jù)網(wǎng)絡URL獲取該網(wǎng)頁上面所有的img標簽并下載圖片

瀏覽:97日期:2022-08-21 14:55:50

說明:根據(jù)網(wǎng)絡URL獲取該網(wǎng)頁上面所有的img標簽并下載符合要求的所有圖片

所需jar包:jsoup.jar

import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.File;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStream;import java.net.MalformedURLException;import java.net.URL;import java.net.URLConnection;import java.util.ArrayList;import java.util.List;import java.util.UUID;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;/** * 圖片批量下載工具類 * @author Marydon * @create time 2016-9-3下午2:01:03 * @update time 2017年9月30日11:07:02 * @E-mail:[email protected] */public class ImgDownloadUtil { /** * 根據(jù)URL獲取網(wǎng)頁DOM對象 * @param url * 網(wǎng)址 * @return DOM對象 */ public static Document getHtmlDocument(String url) { Document document = null; URL urlObj = null; try { // 1.建立網(wǎng)絡連接 urlObj = new URL(url); // 2.根據(jù)url獲取Document對象 document = Jsoup.parse(urlObj, 5000);// 單位:毫秒超時時間 } catch (MalformedURLException e) { System.out.println('世界上最遙遠的距離就是沒有網(wǎng),檢查設置!'); e.printStackTrace(); } catch (IOException e) { System.out.println('您的網(wǎng)絡連接打開失敗,請稍后重試!'); e.printStackTrace(); } return document; } /** * 根據(jù)URL獲取網(wǎng)頁源碼 * @param url * 網(wǎng)址 * @return 網(wǎng)頁源碼 */ public static String getHtmlText(String url) { String htmlText = ''; Document document = null; URL urlObj = null; try { // 1.建立網(wǎng)絡連接 urlObj = new URL(url); // 2.根據(jù)url獲取Document對象 document = Jsoup.parse(urlObj, 5000);// 單位:毫秒超時時間 // 3.根據(jù)dom對象獲取網(wǎng)頁源碼 htmlText = document.html(); } catch (MalformedURLException e) { System.out.println('世界上最遙遠的距離就是沒有網(wǎng),檢查設置!'); e.printStackTrace(); } catch (IOException e) { System.out.println('您的網(wǎng)絡連接打開失敗,請稍后重試!'); e.printStackTrace(); } return htmlText; } /** * 操作Dom對象獲取圖片地址 * @param document * Dom對象 * @return 圖片地址集合 */ public static List<String> getImgAddressByDom(Document document) { // 用于存儲圖片地址 List<String> imgAddress = new ArrayList<String>(); if (null != document) { // <img src='http://www.aoyou183.cn/bcjs/5670.html' alt='' width='' height=''/> // 獲取頁面上所有的圖片元素 Elements elements = document.getElementsByTag('img'); String imgSrc = ''; // 迭代獲取圖片地址 for (Element el : elements) {imgSrc = el.attr('src');// imgSrc的內容不為空,并且以http://開頭if ((!imgSrc.isEmpty()) && imgSrc.startsWith('http://')) { // 將有效圖片地址添加到List中 imgAddress.add(imgSrc);} } } return imgAddress; } /** * 根據(jù)網(wǎng)絡URL下載文件 * @param url * 文件所在地址 * @param fileName * 指定下載后該文件的名字 * @param savePath * 文件保存根路徑 */ public static void downloadFileByUrl(String url, String fileName, String savePath) { URL urlObj = null; URLConnection conn = null; InputStream inputStream = null; BufferedInputStream bis = null; OutputStream outputStream = null; BufferedOutputStream bos = null; try { // 1.建立網(wǎng)絡連接 urlObj = new URL(url); // 2.打開網(wǎng)絡連接 conn = urlObj.openConnection(); // 設置超時間為3秒 conn.setConnectTimeout(3 * 1000); // 防止屏蔽程序抓取而返回403錯誤 conn.setRequestProperty('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)'); // 3.得到輸入流 inputStream = conn.getInputStream(); bis = new BufferedInputStream(inputStream); // 文件保存位置 File saveDir = new File(savePath); if (!saveDir.exists()) {saveDir.mkdirs(); } // 文件的絕對路徑 String filePath = savePath + File.separator + fileName; File file = new File(filePath); // 4. outputStream = new FileOutputStream(file); bos = new BufferedOutputStream(outputStream); byte[] b = new byte[1024]; int len = 0; while ((len = bis.read(b)) != -1) {bos.write(b, 0, len); } System.out.println('info:' + url + ' download success,fileRename=' + fileName); } catch (MalformedURLException e) { System.out.println('世界上最遙遠的距離就是沒有網(wǎng),檢查設置'); System.out.println('info:' + url + ' download failure'); e.printStackTrace(); } catch (IOException e) { System.out.println('您的網(wǎng)絡連接打開失敗,請稍后重試!'); System.out.println('info:' + url + ' download failure'); e.printStackTrace(); } finally {// 關閉流 try {if (bis != null) {// 關閉字節(jié)緩沖輸入流 bis.close();}if (inputStream != null) {// 關閉字節(jié)輸入流 inputStream.close();}if (bos != null) {// 關閉字節(jié)緩沖輸出流 bos.close();}if (outputStream != null) {// 關閉字節(jié)輸出流 outputStream.close();} } catch (IOException e) {e.printStackTrace(); } } }}

測試

public static void main(String[] args) { // 1.確定網(wǎng)址 String url = 'http://www.cnblogs.com/Marydon20170307/p/7402871.html'; // 2.獲取該網(wǎng)頁的Dom對象 Document document = getHtmlDocument(url); // 3.獲取該網(wǎng)頁所有符合要求的圖片地址 List<String> imgAddresses = getImgAddressByDom(document); String imgName = ''; String imgType = ''; // 4.設置圖片保存路徑 String savePath = 'C:/Users/Marydon/Desktop'; // 5.批量下載圖片 for (String imgSrc : imgAddresses) { // 5.1圖片命名:圖片名用32位字符組成的唯一標識 imgName = UUID.randomUUID().toString().replace('-', ''); // 5.2圖片格式(類型) imgType = imgSrc.substring(imgSrc.lastIndexOf('.')); imgName += imgType; // 5.3下載該圖片 downloadFileByUrl(imgSrc, imgName, savePath); }}

以上就是Java 根據(jù)網(wǎng)絡URL獲取該網(wǎng)頁上面所有的img標簽并下載圖片的詳細內容,更多關于java 下載網(wǎng)絡圖片的資料請關注好吧啦網(wǎng)其它相關文章!

標簽: Java
相關文章:
主站蜘蛛池模板: 国产成人精品日本亚洲直接 | 欧美一级看片免费观看视频在线 | 成人另类视频 | 国产精品亚洲一区二区三区在线播放 | 正在播放国产无套露脸 | 69久成人做爰视频 | 国产在线一91区免费国产91 | 国产三级精品播放 | 在线播放国产一区二区三区 | 欧美成人免费mv在线播放 | 国产老肥妇视频 | 久久999视频| 快猫在线观看入口免费网站满十八 | 国产成人在线观看免费网站 | 亚洲一区二区三区四 | 久久五月婷 | 国产精品视频色拍拍 | 一级一级 a爱片免费视频 | 97中文在线 | 黄色xxx| 欧美人在线视频 | 亚洲精品成人一区 | 欧美禁片在线观看免费 | 性短视频在线观看免费不卡流畅 | 国产欧美日韩不卡 | 欧美日韩在线精品成人综合网 | 黄色一级片免费看 | 欧美视频在线观看网站 | 777福利 | 视频在线一区二区 | www.黄色| 成人在线观看视频网站 | 免费看黄色的视频 | 国产成人a一区二区 | 欧美伦理片在线 | 哪里可以免费看毛片 | 久久久综合久久 | 亚洲黄色美女视频 | 黄短视频在线观看免费版 | 亚洲成人在线播放视频 | 综合图色 |