tushov.ru

блог php-программиста, преподавателя и конcультанта

PHP

Исчерпывающий парсинг ссылок в тексте

Необычное название поста я думаю все же объясняет отнюдь не новую проблему парсинга ссылок в тексте. Для тех кто не знает, «парсинг ссылок» — поиск всех ссылок (HTML тегов A) в каком-либо тексте. Задача поиска ссылок может встречаться  в разных случаях, к примеру при написании плагина подобно моему ExtLinks или же может быть вы пишите свой граббер.  Проблема поиска тегов A с помощью регулярного выражения в HTML-тексте, если бы они (ссылки) были написаны с учетом всех правил (валидности записи HTML) и вовсе не была бы проблемой. Однако одинаково правильное написание HTML-кода не всегда встретишь, потому и приходится придумывать чудные регулярки. Одной из таких  регулярок я и хочу поделится с вами:

 

1 Comment

  1. Бдагодарный

    Я не силён в регулярках, так что мне сильно помог Ваш паттерн, спасибо!

Leave a Reply

Theme by Anders Norén