#include <boost/regex.hpp>
Алгоритмregex_replace
Поиск по строке, находящей все совпадения с обычным выражением: для каждого совпадения он затем вызываетРезультаты матча<>::Формат
для форматирования строки и отправки результата на выходной итератор. Разделы текста, которые не совпадают, копируются на выход без изменений, только если флагипараметр не имеет флагаформат_no_copy
Набор. Если флагформат_первый_только
задается только первое событие, а не все события.
template <class OutputIterator, class BidirectionalIterator, class traits, class Formatter>
OutputIterator regex_replace(OutputIterator out,
BidirectionalIterator first,
BidirectionalIterator last,
const basic_regex<charT, traits>& e,
Formatter fmt,
match_flag_type flags = match_default);
template <class traits, class Formatter>
basic_string<charT> regex_replace(const basic_string<charT>& s,
const basic_regex<charT, traits>& e,
Formatter fmt,
match_flag_type flags = match_default);
template <class OutputIterator, class BidirectionalIterator, class traits, class Formatter>
OutputIterator regex_replace(OutputIterator out,
BidirectionalIterator first,
BidirectionalIterator last,
const basic_regex<charT, traits>& e,
Formatter fmt,
match_flag_type flags = match_default);
Перечисляет все случаи выраженияeв последовательности [первый, последний], заменяя каждое происшествие строкой, которая приводит к слиянию найденного совпадения со строкой форматаfmt, и копирует полученную строку виз. В случае, еслиfmtявляется унарным, двоичным или троичным функциональным объектом, то генерируемая этим объектом последовательность символов копируется без изменений на выход при выполнении замены.
Если флагформата_no_copy
установлен вфлагах, то непревзойденные разделы текста не копируются на выход.
Если флагформат_first_only
установлен в флагах, то заменяется только первое появлениее.
Способ, которым интерпретируется строка форматаfmt, наряду с правилами, используемыми для поиска матчей, определяется флагами, установленными вфлагах: см.match_flag_type
.
ТребуетсяТипФормат
должен быть либо указателем на нулевую строку типаchar_type
, либо быть контейнеромchar_type
's (например,std::basic_string<char_type>
), либо быть унарным, двоичным или троичным функтором, который вычисляет заменяющую строку из вызова функции: либоfmtчто
, который должен вернуть контейнерchar_type
's для использования в качестве заменяющего текста, илиfmt, что,изилиизиз,из,из,из,флаги
, оба из которых пишут заменяющий текст на*из
, а затем возвращают новую позицию OutputIterator. В каждом случае
являетсяматч_результаты
объект, который представляет найденный матч. Обратите внимание, что если форматировщик является функтором, то онпередается по значению: пользователи, которые хотят передать функциональные объекты с внутренним состоянием, могут захотеть использоватьBoost.Ref, чтобы обернуть объект так, чтобы он прошел по ссылке.
Эффекты: Построение объектаregex_iterator
:
regex_iterator<BidirectionalIterator, charT, traits, Allocator>
i(first, last, e, flags),
и используетiдля перечисления всех матчейmтипаmatch_results
<187]Двунаправленный итератор>
, которые происходят в последовательности [первый, последний].
Если таких совпадений не обнаружено и
!(flags & format_no_copy)
Затем звонят
std::copy(first, last, out).
Для каждого матча, если
!(flags & format_no_copy)
звонки
std::copy(m.prefix().first, m.prefix().last, out),
А потом звонит
m.format(out, fmt, flags).
Наконец, если
!(flags & format_no_copy)
звонки
std::copy(last_m.suffix().first, last_m,suffix().last, out)
гдеlast_m— копия найденного последнего матча.
Еслифлаги&формат_first_only
ненулевой, то заменяется только первый найденный матч.
Бросает:std::runtime_error
, если сложность сопоставления выражения со строкой символа N начинает превышать O(N2), или если программа исчерпает пространство стека при сопоставлении выражения (если Boost). Regex настраивается в рекурсивном режиме, или если спичечный аппарат исчерпал свое разрешенное выделение памяти (если Boost). Regex настроен в нерекурсивном режиме.
Возвращается:
template <class traits, class Formatter>
basic_string<charT> regex_replace(const basic_string<charT>& s,
const basic_regex<charT, traits>& e,
Formatter fmt,
match_flag_type flags = match_default);
ТребуетсяТипФормат
должен быть либо указателем на нулевую строку типа
's [напримерstdchar_stringchar_type
[239 В каждом случае
являетсярезультатом
объекта, который представляет найденный матч.
Эффекты: Конструирует объектbasic_string<charT>результатregex_replaceback_inserter[результат[результат[результатs]][3
В следующем примере исходный код C/C++ используется в качестве входного, а синтаксис выводит выделенный HTML-код.
#include <fstream>
#include <sstream>
#include <string>
#include <iterator>
#include <boost/regex.hpp>
#include <fstream>
#include <iostream>
boost::regex e1, e2;
extern const char* expression_text;
extern const char* format_string;
extern const char* pre_expression;
extern const char* pre_format;
extern const char* header_text;
extern const char* footer_text;
void load_file(std::string& s, std::istream& is)
{
s.erase();
s.reserve(is.rdbuf()->in_avail());
char c;
while(is.get(c))
{
if(s.capacity() == s.size())
s.reserve(s.capacity() * 3);
s.append(1, c);
}
}
int main(int argc, const char** argv)
{
try{
e1.assign(expression_text);
e2.assign(pre_expression);
for(int i = 1; i < argc; ++i)
{
std::cout << "Processing file " << argv[i] << std::endl;
std::ifstream fs(argv[i]);
std::string in;
load_file(in, fs);
std::string out_name(std::string(argv[i]) + std::string(".htm"));
std::ofstream os(out_name.c_str());
os << header_text;
std::ostringstream t(std::ios::out | std::ios::binary);
std::ostream_iterator<char, char> oi(t);
boost::regex_replace(oi, in.begin(), in.end(),
e2, pre_format, boost::match_default | boost::format_all);
std::string s(t.str());
std::ostream_iterator<char, char> out(os);
boost::regex_replace(out, s.begin(), s.end(),
e1, format_string, boost::match_default | boost::format_all);
os << footer_text;
}
}
catch(...)
{ return -1; }
return 0;
}
extern const char* pre_expression = "(<)|(>)|(&)|\\r";
extern const char* pre_format = "(?1<)(?2>)(?3&)";
const char* expression_text =
"(^[[:blank:]]*#(?:[^\\\\\\n]|\\\\[^\\n[:punct:][:word:]]*[\\n[:punct:][:word:]])*)|"
"(//[^\\n]*|/\\*.*?\\*/)|"
"\\<([+-]?(?:(?:0x[[:xdigit:]]+)|(?:(?:[[:digit:]]*\\.)?[[:digit:]]+"
"(?:[eE][+-]?[[:digit:]]+)?))u?(?:(?:int(?:8|16|32|64))|L)?)\\>|"
"('(?:[^\\\\']|\\\\.)*'|\"(?:[^\\\\\"]|\\\\.)*\")|"
"\\<(__asm|__cdecl|__declspec|__export|__far16|__fastcall|__fortran|__import"
"|__pascal|__rtti|__stdcall|_asm|_cdecl|__except|_export|_far16|_fastcall"
"|__finally|_fortran|_import|_pascal|_stdcall|__thread|__try|asm|auto|bool"
"|break|case|catch|cdecl|char|class|const|const_cast|continue|default|delete"
"|do|double|dynamic_cast|else|enum|explicit|extern|false|float|for|friend|goto"
"|if|inline|int|long|mutable|namespace|new|operator|pascal|private|protected"
"|public|register|reinterpret_cast|return|short|signed|sizeof|static|static_cast"
"|struct|switch|template|this|throw|true|try|typedef|typeid|typename|union|unsigned"
"|using|virtual|void|volatile|wchar_t|while)\\>"
;
const char* format_string = "(?1<font color=\"#008040\">$&</font>)"
"(?2<I><font color=\"#000080\">$&</font></I>)"
"(?3<font color=\"#0000A0\">$&</font>)"
"(?4<font color=\"#0000FF\">$&</font>)"
"(?5<B>$&</B>)";
const char* header_text =
"<HTML>\n<HEAD>\n"
"<TITLE>Auto-generated html formatted source</TITLE>\n"
"<META HTTP-EQUIV=\"Content-Type\" CONTENT=\"text/html; charset=UTF-8\">\n"
"</HEAD>\n"
"<BODY LINK=\"#0000ff\" VLINK=\"#800080\" BGCOLOR=\"#ffffff\">\n"
"<P> </P>\n<PRE>";
const char* footer_text = "</PRE>\n</BODY>\n\n";