Сообщение от Randomize
да хз. Если есть регулярки том в чём угодно можно отпарсить что угодно. Импэ, ты скажи от начала до конца что ты хочешь сотворить.
Собрать со страницы все href и названия ссылок?
тогда:
1) сокетное соединение (загаловки нагуглишь)
2) отрезаешь заголовок ответа ну иконвертишь там в нужную тебе кодировку
3) регуляришь текст
|
Если нужно оффлайн это сотворить, я бы взял node.js, и замутил за 5 минут всё что нужно. Там уже всё есть для этого, никаких не нужно заголовков откидывать, с кодировками гемора никакого, плюс регулярка из коробки тоже.
Намного проще воспользоваться node чем cpp.
Плюс если нужно будет перекочевать на js на front-end'е, код из node можно будет пере использовать.