关于正则表达式：PHP – BBCode 解析器 – 解析 bbcode 链接标记和未标记链接

PHP – BBCode parser – Parse both bbcode link tag and not tagged link

我需要这样做：

当用户插入一个 BBCode 标签时，我会使用 preg_replace 和 regex 进行一些转换。

例如

1
2
3
4
5
6
7
8
9
10
11
12
13

function forumBBCode($str){
$format_search=array(
‘#//[url=(.*?)//](.*?)//[/url//]#i’
);

$format_replace=array(
‘$2’
);

$str=preg_replace($format_search, $format_replace, $str);
$str=nl2br($str);
return $str;
}

现在我也想要这个：当用户插入带有链接的普通文本时，这也必须被转换。我无法通过 preg_replace 函数执行此操作，因为如果我将代码编写为

1
2
3
4
5

$format_search
‘#(www//..*?)#i’

$format_replace
‘$1’

它将转换链接 2 次(在 [url] 中以及当链接没有此标记时)。

所以我认为这个功能：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

function checkLinks($string) {
$arrelab="";
$arr=split(‘ |/
/
‘, $string);
for($i=0; $i<sizeof($arr); $i++) {
echo $i." -".$arr[$i]."<br/>";
if ((strpos($arr[$i], ‘www.’)!==false) or (strpos($arr[$i], ‘http://’)!==false) or (strpos($arr[$i], ‘ftp://’)!==false)) {
if (strpos($arr[$i], ‘[url=’)===false) {
$arr[$i]=”.$arr[$i].”;
}
}

$arrelab=$arrelab."".$arr[$i];
}
return $arrelab;
}

问题是我需要拆分换行符，至于空格。
任何帮助将不胜感激。

附言对不起我的英语不好:)

干杯

使用后向断言很容易解决。

1	preg_replace(‘#(?<![>/"])((http://)?www………)#im’, ‘$1’

因此，正则表达式将跳过任何包含在” 或 > 中或以 / 开头的 URL
这是一种解决方法，而不是解决方案。

PS: target=”_blank” 是用户纠缠。把它剪掉。

最简单的选择是首先解析纯文本网址，并确保它们不会立即出现在等号之后。

来自马里奥斯的更新：

preg_replace(‘#(?<![>/”])(((http|https|ftp)://)?www[a-zA-Z0-9//-_//.]+)#im’, ‘$1’

有一种更简单的方法可以做到这一点。我在 RedBonzai 开发人员博客中创建了一个演练。它的链接在这里：http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/

如果您有任何问题，请告诉我。

RedBonzai

你的问题可以通过阅读你的标题来识别..结合正则表达式进行解析

您不能使用正则表达式”解析”html 或 bb 代码，因为它们不是正则语言。

你应该编写(或找到)一个 bb 代码解析器，而不是使用正则表达式。

Google 的第一个 BB 代码解析器结果是 NBBC：新的 BBCode 解析器。但我从未使用过它，所以我无法评论质量。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/tech/pnotes/268436.html

关于正则表达式：PHP – BBCode 解析器 – 解析 bbcode 链接标记和未标记链接

PHP – BBCode parser – Parse both bbcode link tag and not tagged link

相关推荐

发表回复