java 解析html 提取超链接,然后将超链接存储到文本中

2024-12-16 23:54:42
推荐回答(2个)
回答1:

html源文件里超文本引用(hypertext reference)也叫超链接都是有特殊的标签的有不有。
举个例子:href="http://zhidao.baidu.com/question/158971081.html" 格式都是这样的有木有。
你可以在网页空白处右击选择 查看源文件 然后自己看看每个超链接都是上面的格式有木有。
如果要自己写java程序的话,建议
1.先读取一个html的源文件
2.然后用上面朋友的建议,用正规表达式来识别。
也可以自己找专门的html分析工具哦。

回答2:

晕 你想搞蜘蛛程序呀 这个要用到正则表达式,判断需要的内容是否合适。然后保存起来。