Quantcast
Channel: Linux.org.ru: Форум (тех. форум)
Viewing all articles
Browse latest Browse all 73880

Как заменить неизвестное заранее число вхождений в QRegExp

$
0
0

Есть многострочный HTML-текст (по сути, валидный XML), в котором могут встречаться такие конструкции:

<span разные_атрибуты>  </span>
<span разные_атрибуты>    </span>
<span разные_атрибуты> </span>


Да, это именно «пробельный» текст с разным количеством пробелов.

Задача: заменить все такие вхождения на такие:

<span разные_атрибуты>&#65533;&#65533;</span>
<span разные_атрибуты>&#65533;&#65533;&#65533;&#65533;</span>
<span разные_атрибуты>&#65533;</span>


В других местах заменять пробелы на «&#65533;» не требуется.

Обрабатывать нужно именно регулярными выражениями. Потому что, например, парсинг в DOM (с последующим обратным преобразованием) не сделает текстовую ноду из одних пробелов внутри ноды span.

Вопрос: как это сделать регулярками? Вот заготовка:

QRegExp replaceSpaceTagsEx("<span.*>(\\s*)</span>");
replaceSpaceTagsEx.setMinimal(true);
htmlCode.replace(replaceSpaceTagsEx, "?????");


Что надо прописать вместо знаков вопроса? Или надо делать как-то по-другому?

 , , ,


Viewing all articles
Browse latest Browse all 73880

Trending Articles