java 如何去除html中的一个指定标签和指定标签里的内容

用java代码去除html中的一个指定标签和指定标签里的内容
2024-11-27 18:57:52
推荐回答(4个)
回答1:

java处理html指定标签最好用正则表达式。例如要去除html中所有的h1标签和类容就可以用下面的演示代码:

package konw.reg;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RemoveTag
{
    public static void main(String[] args)
    {
        FileReader fr;
        String content =null;
        String regex = "<[Hh]1>.*";
        try
        {
            fr = new FileReader("tag.html");
            BufferedReader br = new BufferedReader(fr);
            String str = null;
            StringBuffer sb = new StringBuffer();
            while((str = br.readLine()) != null)
            {
                sb.append(str+"\n");
            }
            content = sb.toString();
            br.close();
            
        } catch (FileNotFoundException e)
        {
            e.printStackTrace();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(content);
        StringBuffer sb1 = new StringBuffer();
        while(matcher.find())
        {
            sb1.append(matcher.replaceAll("")+"\n");
        }
        try
        {
            FileWriter fw = new FileWriter("tag.html");
            BufferedWriter bw = new BufferedWriter(fw);
            fw.write(sb1.toString());
            bw.close();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
    }
}

回答2:

你好,可以用正则表达式。比如想要去除id为test的div标签及其内容:
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Person{
public static void main(String[] args) {
//正则表达式
Pattern p = Pattern.compile("");
//测试用的html代码
String str = "aa

bb
";
Matcher m = p.matcher(str);
//去除标签
String result = m.replaceAll("");

System.out.println(result);
}
}

回答3:

java不行,得javaScript
用getElementById()方法获取该标签,然后对标签进行操作

回答4:

JavaScript?


给定标签一个id, 譬如 labe_xxx

$("#label_xxx").empty();

$("#label_xxx").remove();