<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Eeq's Blog &#187; 正则表达式</title>
	<atom:link href="http://www.iteeq.com/archives/tag/%e6%ad%a3%e5%88%99%e8%a1%a8%e8%be%be%e5%bc%8f/feed" rel="self" type="application/rss+xml" />
	<link>http://www.iteeq.com</link>
	<description>Just a bloger's blog!</description>
	<lastBuildDate>Mon, 03 May 2010 13:37:24 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Editplus正则表达式的两个实用例子</title>
		<link>http://www.iteeq.com/archives/338</link>
		<comments>http://www.iteeq.com/archives/338#comments</comments>
		<pubDate>Wed, 28 Jan 2009 18:59:54 +0000</pubDate>
		<dc:creator>EEQ</dc:creator>
				<category><![CDATA[网络相关]]></category>
		<category><![CDATA[Editplus]]></category>
		<category><![CDATA[正则表达式]]></category>

		<guid isPermaLink="false">http://iteeq.com/?p=338</guid>
		<description><![CDATA[网站采集平时用软件做得太多了, 所以一撞上某些需要手工采集的内容时, 自然就会想起各种采集器的过滤规则~
现在, 来说一下怎么用EDITPLUS替换功能里面的正则静态式来实现内容过滤~
以下放出两个我常用的正则表达式~
1. ([^!&#124;#&#124;@]*) 万能匹配
对的, 就像某些采集程序里面的(*)类似的代码, 可以用来代替任何字符~
虽然说是万能, 不过不是真的万能, 详细解释一下,
这句表达式的意思是-&#62;内容不等于!和@和#
当然,这里的!@#我只是顺手SHIFT123这样打出来的, 你可以替换为自己的符号,不替换直接拿去用, 一般情况都可以满足到, 除非你要替换的语句里面同时拥有!@#这三个符号~
实例:
&#60;a href=&#34;http://iteeq.com&#34;&#62;EEQ的博客&#60;/a&#62;
&#60;a href=&#34;http://google.com&#34;&#62;Googlebai&#60;/a&#62;
&#60;a href=&#34;http://baidu.com&#34;&#62;百度&#60;/a&#62;
要求只要去掉连接,只留下文字
查找:
&#60;a href=&#34;([^!&#124;#&#124;@]*) &#34;&#62;
替换为:(空白,不用写任何东西)
结果:
EEQ的博客&#60;/a&#62;
Googlebai&#60;/a&#62;
百度&#60;/a&#62;
OK,所有连接头都清除了~ 再直接把后面那个/a替换为空就完事~

2. \1 的用法
\1的作用是用于保留有用的语句, 把其他的内容换掉~ 下面直接看实例吧~
清除完链接, 有时还会出现下面这样的内容
我是低俗的人
我是很黄很暴力的人
我是打酱油的人
恩,这样的语句太自私了&#8230;.换掉~
查找:
我是([^!&#124;#&#124;@]*)的人
替换为:
我们是\1的
结果:
我们是低俗的
我们是很黄很暴力的
我们是打酱油的
没错的, 好的行为应该大家一起干~
哼哼~ 好了, 大概意思大家明白就行, 替换的内容要理也不用理哈~
好, 今天就这样~ 睡觉去~
]]></description>
			<content:encoded><![CDATA[<p>网站采集平时用软件做得太多了, 所以一撞上某些需要手工采集的内容时, 自然就会想起各种采集器的过滤规则~</p>
<p>现在, 来说一下怎么用EDITPLUS替换功能里面的正则静态式来实现内容过滤~</p>
<p>以下放出两个我常用的正则表达式~</p>
<p><strong>1. ([^!|#|@]*) 万能匹配</strong></p>
<p>对的, 就像某些采集程序里面的(*)类似的代码, 可以用来代替任何字符~<br />
虽然说是万能, 不过不是真的万能, 详细解释一下,<br />
这句表达式的意思是-&gt;内容不等于!和@和#<br />
当然,这里的!@#我只是顺手SHIFT123这样打出来的, 你可以替换为自己的符号,不替换直接拿去用, 一般情况都可以满足到, 除非你要替换的语句里面同时拥有!@#这三个符号~</p>
<p>实例:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">&lt;a href=&quot;http://iteeq.com&quot;&gt;EEQ的博客&lt;/a&gt;</li>
<li>&lt;a href=&quot;http://google.com&quot;&gt;Googlebai&lt;/a&gt;</li>
<li>&lt;a href=&quot;http://baidu.com&quot;&gt;百度&lt;/a&gt;</li></ol></div>
<p>要求只要去掉连接,只留下文字<br />
查找:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">&lt;a href=&quot;([^!|#|@]*) &quot;&gt;</li></ol></div>
<p>替换为:(空白,不用写任何东西)<br />
结果:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">EEQ的博客&lt;/a&gt;</li>
<li>Googlebai&lt;/a&gt;</li>
<li>百度&lt;/a&gt;</li></ol></div>
<p>OK,所有连接头都清除了~ 再直接把后面那个/a替换为空就完事~</p>
<p><span id="more-338"></span><br />
<strong>2. \1 的用法</strong></p>
<p>\1的作用是用于保留有用的语句, 把其他的内容换掉~ 下面直接看实例吧~</p>
<p>清除完链接, 有时还会出现下面这样的内容</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">我是低俗的人</li>
<li>我是很黄很暴力的人</li>
<li>我是打酱油的人</li></ol></div>
<p>恩,这样的语句太自私了&#8230;.换掉~<br />
查找:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">我是([^!|#|@]*)的人</li></ol></div>
<p>替换为:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">我们是\1的</li></ol></div>
<p>结果:</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">我们是低俗的</li>
<li>我们是很黄很暴力的</li>
<li>我们是打酱油的</li></ol></div>
<p>没错的, 好的行为应该大家一起干~<br />
哼哼~ 好了, 大概意思大家明白就行, 替换的内容要理也不用理哈~</p>
<p>好, 今天就这样~ 睡觉去~</p>
]]></content:encoded>
			<wfw:commentRss>http://www.iteeq.com/archives/338/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
