正则表达式匹配网页标签之间任意字符(包括换

利用在线正则表达式测试工具,快捷测试匹配网页文章内容的正则表达式,匹配指定标签之间内容内容,包括换行和空白字符。
今天上手使用正则表达式来获取网页class为content的div内的内容,目标网页代码如下所示: 
 
 
         
我们以前曾经解释过404错误页面产生的原因,一旦访客进入404页面,他们很可能不知道下一步该做什么。他们正在搜索的页面也许已被转移,所以你应该尽可能地帮助他们找到它,或是他们查找的页面可能已被删除,这意味着他们很可能会离开你的网站,除非你可以激
         
 
           

   我们以前曾经解释过404错误页面产生的原因,一旦访客进入404页面,他们很可能不知道下一步该做什么。他们正在搜索的页面也许已被转移,所以你应该尽可能地帮助他们找到它,或是他们查找的页面可能已被删除,这意味着他们很可能会离开你的网站,除非你可以激励他们留下来。

你可以做很多事情来改进你的错误页面,我们列出了以下一些具有创造性和启发性的建议:

           

 

         
       


http://tool.chinaz.com/regex/

最终获取结果如下:
正则表达式
 
开始写的正则是
(.*),写到这里时发现无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“ ”以外的所有字符。同时,手册上还有一句话:要匹配包括 ' ' 在内的任何字符,请使用像 '[. ]' 的模式。于是我将正则表达式的匹配规则修改如下: 
[. ]*,写完后发现还是无法获得换行后的文本。 
上网查了一番,找到了正确的匹配表达式,以下为正确的正则表达式匹配规则: 
[sS]*

 

s*
同时,也可以用 “([dD]*)”、“([wW]*)” 来表示。 
 
 
在文本文件里, 这个表达式可以匹配所有的英文 
/[ -~]/ 
这个表达式可以匹配所有的非英文(比如中文) 
/[^ -~]/ 
/是VI里用的. 你在editplus或程序里不需要/ 

发表评论

点击我更换图片
最新评论
友情连接:六一宝妈网