×

jsoup获取a标签href

jsoup获取a标签href(java语言获取网页标签中的内容)

admin admin 发表于2024-02-08 13:37:53 浏览29 评论0

抢沙发发表评论

大家好,关于jsoup获取a标签href很多朋友都还不太明白,不过没关系,因为今天小编就来为大家分享关于java语言获取网页标签中的内容的知识点,相信应该可以解决大家的一些困惑和问题,如果碰巧可以解决您的问题,还望关注下本站哦,希望对各位有所帮助!

本文目录

java语言获取网页标签中的内容

新浪的那个天气的值是通过js动态加载的,原始html页面是《div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"》《/div》 。而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。

使用jsoup解析html网页时,如果一个标签[2]怎么解析到这个href

其实你这个问题说简单也简单,说麻烦也麻烦,首先拼真实的url时,它是通过一个js方法实现的,只要用java代码模拟这个过程就OK了。麻烦的是你这个URL中含有中文 ,传入时会乱码,导致查询结果为空。不知道,我说的对不对,我们可以讨论一下。

java 怎么获取网站中所有的a标签,以及a标签里面的内容

//以下演示针对已经获取html源码后进行过滤,把过滤后的地址进行保存!import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.io.UnsupportedEncodingException;import java.util.regex.Matcher;import java.util.regex.Pattern;public class Day02_ReadUrl {***隐藏网址******隐藏网址***+ "\\w\\-_]+)+()?";// a标签过滤!final static String href = "《a\\b*?)《/a》";// 文件目录static File dir = new File("k:/Test");public static void main(String args) {// 创建关联读取文件File readFile = new File(dir, "TestUrl.txt");***隐藏网址***File href=new File(dir,"href.txt");// 如果文件存在就继续!if (readFile.canExecute()) {***隐藏网址***}}// 开始读取文件!***隐藏网址***BufferedReader br = null;final PrintWriter p1,p2;try {br = new BufferedReader(new InputStreamReader(new FileInputStream(file), "GBK"));***隐藏网址***p2=new PrintWriter(new FileOutputStream(href,false),true);for (String str = br.readLine(); str != null; str = br.readLine()) {getHttp(str,p1);getHref(str,p2);}} catch (UnsupportedEncodingException e) {e.printStackTrace();} catch (FileNotFoundException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} finally {if (br != null) {try {br.close();} catch (IOException e) {e.printStackTrace();}}}}// 获取所有链接!private static void getHttp(String str,PrintWriter pw) {***隐藏网址***while(m.find()) {pw.println(m.group());}}// 获取所有A标签private static void getHref(String str, PrintWriter pw) {final Matcher m=Pattern.compile(href).matcher(str);while(m.find()) {pw.println(m.group());}}}

java获取网页内容中所有的标签的href属性指向的地址,并在屏幕打印出来 即是查找href=和>之间的数据

***隐藏网址***URL url = ...Document doc = Jsoup.parse(url, 3000);Elements elements = doc.select("a");for(Element element : elements){ System.out.println(element.attr("href"));}

java语言获取网页标签中的内容的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java语言获取网页标签中的内容、java语言获取网页标签中的内容的信息别忘了在本站进行查找哦。