forum.boolean.name

forum.boolean.name (http://forum.boolean.name/index.php)
-   Алгоритмика (http://forum.boolean.name/forumdisplay.php?f=21)
-   -   URL в теле страницы (http://forum.boolean.name/showthread.php?t=17068)

impersonalis 22.07.2012 21:36

URL в теле страницы
 
Есть тело страницы (HTML). Необходимо выделить из него все ссылки (так или иначе доступные пользователю [в том числе, отображаемые в виде картинок], но без учёта всяких интегрируемых объектов типа перехода при клике внутри flash-объекта [от которого в HTML останется лишь уопминание]). Т.к. я не обладаю всем множеством возможных комбинаций для тестов, то спрошу. Верен ли алгоритм:
найти вхождение <a - это будет левая граница.
От найденного вхождения до > найти параметр href - его значение = искомый url.
Или всё гораздо сложнее?

RegIon 23.07.2012 17:59

Ответ: URL в теле страницы
 
проще:
PHP код:

<script>
var 
obj=document.body.getElementsByTag("a");
for(var 
i=0;i<obj.length;i++)
           
alert(obj[i].getAttribute('href'));
</script> 

инклудим в страницу и все ссылки алертом

impersonalis 23.07.2012 21:00

Ответ: URL в теле страницы
 
Спасибо, но в реализации твоей многое сокрыто за непонятными мне методами. Нельзя или их более отвлечённо от языка описать?

ABTOMAT 23.07.2012 21:06

Ответ: URL в теле страницы
 
PHP код:

<script>
var 
obj=document.body.getElementsByTag("a"); // из body страницы берутся все элементы "a"
for(var i=0;i<obj.length;i++) // Перебор их
           
alert(obj[i].getAttribute('href')); // Алертим атрибут href
</script> 

Правда я не уверен что Имперу годится жабаскриптовая реализация (правда если у Ипмера нет веских причин делать свой парсер лучше воспользоваться услугами браузера). А ещё я бы советовал юзать jQuery:
PHP код:

<script>
var 
links = $('a');
for(var 
i=0;i<links.length;i++){alert($(links[i]).attr('href'))}
</script> 


moka 23.07.2012 21:12

Ответ: URL в теле страницы
 
Если таки не в броузере а жабой, то тебе нужно искать открытие тега и закрытие. Чтобы подсветить, будет достаточно в открытии тега <a> до ">" добавить что-то типо:
style="background:#f00 !important"
Ссылка будет иметь тогда красный фон.
Если таки в броузере, делай примерно как описали. Если предоставишь пример html разметки, можно будет собрать jsfiddle пример.

ЗЫ, выкиньте же этот alert нафиг!

ABTOMAT 23.07.2012 21:17

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 233959)
Если таки не в броузере а жабой, то тебе нужно искать открытие тега и закрытие. Чтобы подсветить, будет достаточно в открытии тега <a> до ">" добавить что-то типо:
style="background:#f00 !important"
Ссылка будет иметь тогда красный фон.
Если таки в броузере, делай примерно как описали. Если предоставишь пример html разметки, можно будет собрать jsfiddle пример.

ЗЫ, выкиньте же этот alert нафиг!

Не во всех браузерах работает console.log

SBJoker 23.07.2012 21:38

Ответ: URL в теле страницы
 
Регэкспом его!

moka 23.07.2012 21:51

Ответ: URL в теле страницы
 
Ну ты же не будешь разрабатывать в IE (в котором он не работает), поэтому использовать его нужно.

Разные броузеры по разному работают с alert'ами, некоторые не дают возможности отключить последующий скрипт, тем самым если ты запустишь такой код на огромной странице, с кучей ссылок, прийдётся зажимать enter или вырубать броузер, врубать снова и резко закрывать закладку (т.к. многие броузеры блокируют любой инпут мобальным окошком alert'а).

Разрабатывать нужно в FF + FireBug либо в Chrome. Можно заюзать также Espresso 2 (на маках рулит) для оффлайн разработки, там есть WebKit (как в Chrome) Inspector.

ABTOMAT 23.07.2012 21:57

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 233966)
Ну ты же не будешь разрабатывать в IE (в котором он не работает), поэтому использовать его нужно.

Разные броузеры по разному работают с alert'ами, некоторые не дают возможности отключить последующий скрипт, тем самым если ты запустишь такой код на огромной странице, с кучей ссылок, прийдётся зажимать enter или вырубать броузер, врубать снова и резко закрывать закладку (т.к. многие броузеры блокируют любой инпут мобальным окошком alert'а).

Разрабатывать нужно в FF + FireBug либо в Chrome. Можно заюзать также Espresso 2 (на маках рулит) для оффлайн разработки, там есть WebKit (как в Chrome) Inspector.

Я в курсе. Для себя я использую console.log.
Когда вываливаю в Сеть примеры - меняю на alert.
Потому что например даже в FF без установленного FireBug вывод console.log не увидеть.
Всем постоянно говорю что Firebug нужно ставить но - как об стенку горох, а потом "а чо ничо не пишет?", надеюсь, ты меня понял.

impersonalis 23.07.2012 22:04

Ответ: URL в теле страницы
 
Цитата:

Сообщение от SBJoker (Сообщение 233963)
Регэкспом его!

Вариант конечно: нарезать по разделителям (пробелы, скобки <> и проч) страницу и прогнать элементы. Но мне казалось, что это более "в лоб". Думал регэксп использовать чтоб забраковать href-ы содержащие ссылки, получаемые в результате выполнения скрипта (т.е. не содержащие ссылки в явном виде).

moka 23.07.2012 22:22

Ответ: URL в теле страницы
 
Цитата:

Сообщение от ABTOMAT (Сообщение 233969)
Потому что например даже в FF без установленного FireBug вывод console.log не увидеть.
Всем постоянно говорю что Firebug нужно ставить но - как об стенку горох, а потом "а чо ничо не пишет?", надеюсь, ты меня понял.

MacOS X: Cmnd + Alt + K
Windows: Ctrl + Shift + K
Чтобы открыть штатный консоль. Он кстати как по мне намного лучше чем FireBug'овский.

ABTOMAT 23.07.2012 22:35

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 233975)
MacOS X: Cmnd + Alt + K
Windows: Ctrl + Shift + K
Чтобы открыть штатный консоль. Он кстати как по мне намного лучше чем FireBug'овский.

Так было не всегда.
Хватит спорить с моими привычками.

Randomize 23.07.2012 23:59

Ответ: URL в теле страницы
 
Цитата:

Сообщение от impersonalis (Сообщение 233971)
Вариант конечно: нарезать по разделителям (пробелы, скобки <> и проч) страницу и прогнать элементы. Но мне казалось, что это более "в лоб". Думал регэксп использовать чтоб забраковать href-ы содержащие ссылки, получаемые в результате выполнения скрипта (т.е. не содержащие ссылки в явном виде).

Фактически ссылки это:

<a{блабла}href="{блабла}"{блабла}>{блабла}</a>

То есть:
Цитата:

#<a\s[^>]*href=\"([^\"]*)\"[^>]*>(.*)<\/a>#siU

impersonalis 24.07.2012 10:55

Ответ: URL в теле страницы
 
Цитата:

Сообщение от Randomize (Сообщение 233996)
Фактически ссылки это:

<a{блабла}href="{блабла}"{блабла}>{блабла}</a>

То есть:

Если я применю этот регэксп целиком к телу, то получу просто false, не так ли? На что опираться выбирая разделители для нарезки тела на потенциальные ссылки?

moka 24.07.2012 13:50

Ответ: URL в теле страницы
 
Начало тега всегда одно "<a" далее может быть что угодно кроме ">" вне кавычек (это не просто вычислить). Далее рано или поздно будет (не обязательно кстати) "href=", кавычка может быть двойная за ним, или одинарная. Далее идёт что угодно кроме закрытия кавычки. Потом идёт опять что угодно до ">" вне открытых каких-либо кавычек.
То что между кавычек у href="", является ссылкой на которую будет перенаправление.
Далее после ">" может быть что угодно до "</a>". Основываясь W3C, ссылки в ссылке не может быть, и броузеры тоже такое не позволят.
Всё что между <a ....> и </a> будет телом ссылки, там может быть картинка (<img />), элементы, или текст. А может быть даже пусто, т.к. можно сделать элемент ссылки блоком и отображать с background'ом - альтернатива img, и лучше по многим факторам.

impersonalis 24.07.2012 17:21

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 234083)
Далее рано или поздно будет (не обязательно кстати) "href="

поподробнее?

ABTOMAT 24.07.2012 17:33

Ответ: URL в теле страницы
 
Атрибута href может и не оказаться у элемента a.
Вообще элемент - это
PHP код:

<название_элемента атрибут1="значение" атрибут2="значение" ... атрибутN="значение">тело</название_элемента

В-общем, тот же XML.
Ещё может быть самозакрывающийся вариант
PHP код:

<название_элемента атрибуты /> 

Но он к a не относится.

Вообще по сути можно юзать парсер XML для этой цели, но помни, что какие только Васи Пупкины не пишут в Интернете. Поэтому готовься к незакрытым тегам, значениям атрибутов без кавычек и т.д.
Именно поэтому я бы советовал использовать (если это возможно) бравузер+javascript+jQuery, т.к. парсер DOM браузера уже готов к таким сюрпризам. Не надо за него изобретать велосипед.

Вообще если не секрет какое назначение программы? "На один раз"? Дистрибьюция?

impersonalis 24.07.2012 18:00

Ответ: URL в теле страницы
 
Цитата:

Сообщение от ABTOMAT (Сообщение 234108)
Вообще если не секрет какое назначение программы? "На один раз"? Дистрибьюция?

Пишу пока чисто для себя. В прошлом несколько раз приходилось писать такие приложения, но там я примерно представлял как выглядит ссылка и её окружение (писалось для взаимодействия с конкретным сайтом). Писалось "на один раз": повзаимодействоали n часов - и достаточно. Потому писалось весьма хардкодно.
Хотелось бы на потенциальное будущее иметь возможность пропарсить страницу на ссылки, а затем отобрать нужные по маске или регэкспом.
Вот.
Но, видать, овчинка выделки не стоит.

moka 24.07.2012 18:31

Ответ: URL в теле страницы
 
Если научишься пользоваться JS, то есть такая клёвая штука как Scratchpad в Firefox.
Там можно открыть просто страницу, открыть Scratchpad, и туда вбить какой-то скрипт, и запустить его. Таким образом он будет выполнен, без необходимости менять реальный код страницы, и вообще никто об этом не узнает, и не нужно использовать посторонних инструментов.
Данные и результаты можно от туда же выводить в консоль, или вообще кодом создать модальный элемент и туда вставить данные результат твоих махинаций, если таковые имеются.

ABTOMAT 24.07.2012 18:42

Ответ: URL в теле страницы
 
Можно также и в консоль FireBug'а

impersonalis 24.07.2012 18:49

Ответ: URL в теле страницы
 
Спасибо, но предполагалось это сделать на цпп без привлечения большого числа инструментов, тем более сторонних приложений.
Ну варианты ясны - спасибо за обзор возможностей.

Randomize 24.07.2012 18:55

Ответ: URL в теле страницы
 
Кстати да, xml же:
http://www.sourceforge.net/projects/tinyxml

ABTOMAT 24.07.2012 18:57

Ответ: URL в теле страницы
 
Импер, правой кнопкой в любом месте страницы (я знаю, ты Оператор)
Проинспектировать элемент
Справа выбери вкладку "Консоль"
Вставляй туда вот это:
PHP код:

var obj=document.body.getElementsByTagName("a");for(var i=0;i<obj.length;i++) {if(obj[i].getAttribute('href')) {console.log(obj[i].getAttribute('href'));}} 

Энтер

Всё. Надо ли тебе теперь изобретать велосипед - решай сам.

moka 24.07.2012 19:27

Ответ: URL в теле страницы
 
Привлечение cpp - это уже огромный геморой с точки зрения web'а, когда в броузерах всё есть, просто заюзать нужно.

Randomize 24.07.2012 19:42

Ответ: URL в теле страницы
 
да хз. Если есть регулярки том в чём угодно можно отпарсить что угодно. Импэ, ты скажи от начала до конца что ты хочешь сотворить.

Собрать со страницы все href и названия ссылок?
тогда:
1) сокетное соединение (загаловки нагуглишь)
2) отрезаешь заголовок ответа ну иконвертишь там в нужную тебе кодировку
3) регуляришь текст

moka 24.07.2012 20:34

Ответ: URL в теле страницы
 
Цитата:

Сообщение от Randomize (Сообщение 234135)
да хз. Если есть регулярки том в чём угодно можно отпарсить что угодно. Импэ, ты скажи от начала до конца что ты хочешь сотворить.

Собрать со страницы все href и названия ссылок?
тогда:
1) сокетное соединение (загаловки нагуглишь)
2) отрезаешь заголовок ответа ну иконвертишь там в нужную тебе кодировку
3) регуляришь текст

Если нужно оффлайн это сотворить, я бы взял node.js, и замутил за 5 минут всё что нужно. Там уже всё есть для этого, никаких не нужно заголовков откидывать, с кодировками гемора никакого, плюс регулярка из коробки тоже.
Намного проще воспользоваться node чем cpp.
Плюс если нужно будет перекочевать на js на front-end'е, код из node можно будет пере использовать.

Randomize 24.07.2012 21:12

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 234141)
Если нужно оффлайн это сотворить, я бы взял node.js, и замутил за 5 минут всё что нужно.

Чё вы все со своим вебом то? А если импэ пишет софт, котрый показывает рекламу с некого сайта, то предлагаете полностью всю софтину на ноде переписать? Импэ сказал C++ значит C++.

moka 24.07.2012 21:21

Ответ: URL в теле страницы
 
node - это не веб лол.
Если взять за пример который ты предложил, как раз node - это ваще проще простого.

Тупо парсишь все баннеры и картинки, и через веб-сокет выдаёшь хтмл разметку уже с выдранными данными, не нужно качать картинки (ссылки и так прямые), и куча ещё плюшек.
Так что для таких задачь, node в разы круче и удобнее чем C++.

Автор топика не сказал о конкретных потребностях, но судя по тому что это "одноразовые" использования, и не публичный софт, то следственно скорее всего автор просто занимается добычей данных с сайтов, для этого node один из первых на данную роль. Следи за тем что творить в последнее время, и вижу у тебя баттхёрты в плане node'а, или то что я что-то предлагаю?

impersonalis 24.07.2012 21:24

Ответ: URL в теле страницы
 
Всем спасибо.

Randomize 24.07.2012 21:32

Ответ: URL в теле страницы
 
Цитата:

Сообщение от MoKa (Сообщение 234151)
Автор топика не сказал о конкретных потребностях, но судя по тому что это "одноразовые" использования, и не публичный софт, то следственно скорее всего автор просто занимается добычей данных с сайтов, для этого node один из первых на данную роль. Следи за тем что творить в последнее время, и вижу у тебя баттхёрты в плане node'а, или то что я что-то предлагаю?

Нет, просто ситуация выглядит так:

X: Здравствуйте, меня есть грузовик, как мне правильно перевезти шкаф?
Y: Я умею водить троллейбус, так что возьми троллейбус (Автомат и прочие с жикверями)
Z: Я умею водить трактор, возьми трактор (Мока с нодой)

Нет баттхёрта от ноды. Нода малаца. Просто пойми, я тут тоже мог предложить PHP или Ruby ну или Perl. А можно и линукс поставить с wget`oм и башем. Мог предложить даже WScript. Но всё это не верные пути. Я полагаю, что топик стартеру кроме парса страницы надо будет ещё что либо (например рендер шняги в Xors3D)

moka 24.07.2012 21:44

Ответ: URL в теле страницы
 
Цитата:

Сообщение от Randomize (Сообщение 234157)
Нет, просто ситуация выглядит так:

Твоё видение ситуации кардинально отличается от моего.

Цитата:

Сообщение от Randomize (Сообщение 234157)
X: Здравствуйте, меня есть грузовик, как мне правильно перевезти шкаф?
Y: Я умею водить троллейбус, так что возьми троллейбус (Автомат и прочие с жикверями)
Z: Я умею водить трактор, возьми трактор (Мока с нодой)

X: Здраствуйте, мне нужно перевезти шкаф.
Y: Бери BMW ван, и перевози.
Z: Бери Node грузовик, он отлично подходит, как раз для твоего груза создан.
X: У меня есть трактор.

Цитата:

Сообщение от Randomize (Сообщение 234157)
Нет баттхёрта от ноды. Нода малаца. Просто пойми, я тут тоже мог предложить PHP или Ruby ну или Perl. А можно и линукс поставить с wget`oм и башем. Мог предложить даже WScript. Но всё это не верные пути. Я полагаю, что топик стартеру кроме парса страницы надо будет ещё что либо (например рендер шняги в Xors3D)

Речь идёт о вебе.
Если ты возьмёшь всё что ты перечислил выше, то подход будет пачти такой же как в C++, немножко может комфортее в Perl'е, но там нужно знать фичи и либы юзать.

Я же предложил что создано для таких задачь от части, речь идёт о парсинге веб данных, я предложил инструмент который адаптирован для этого. Не более.

Снова повторюсь: топикстартер пометил что юзал для подобного, но не сказал ничего о том что будет именно это юзать, и ничего о том что собирается делать. Следственно все предположения читателей - не имеют отношения к топикстартеру.

ABTOMAT 24.07.2012 21:55

Ответ: URL в теле страницы
 
Цитата:

Сообщение от Randomize (Сообщение 234157)
Нет, просто ситуация выглядит так:

X: Здравствуйте, меня есть грузовик, как мне правильно перевезти шкаф?
Y: Я умею водить троллейбус, так что возьми троллейбус (Автомат и прочие с жикверями)
Z: Я умею водить трактор, возьми трактор (Мока с нодой)

Нет баттхёрта от ноды. Нода малаца. Просто пойми, я тут тоже мог предложить PHP или Ruby ну или Perl. А можно и линукс поставить с wget`oм и башем. Мог предложить даже WScript. Но всё это не верные пути. Я полагаю, что топик стартеру кроме парса страницы надо будет ещё что либо (например рендер шняги в Xors3D)

Минуточку, Импер вообще не сказал, что у него есть грузовик. Так что я предложил своё решение. Если бы вопрос стоял как "Дайте мне решение для грузовика", то ситуация была бы иная.
Опоздал, Мока уже написал что я хотел.

impersonalis 25.07.2012 00:17

Ответ: URL в теле страницы
 
Ну, раз уж вы строите предположения, то лучшая аналогия:

хх: здравствуйте, научите меня делить столбиком. Правильно ли я делаю: (пример деления двух чисел)
yy: бери калькулятор
zz: бери MATLAB

Часть домыслов отпадает, если обратить внимание на раздел: "Алгоритмика" - подразумевается общее решение (а-ля псевдокод), ну или указание на его титаническую сложность в таком виде. Т.е. задав вопрос о сортировке числе, я ожидаю увидеть что-то вроде описания алгоритма вставок, пузырька, челночной и т.п., а не "юзай функцию super_sort (реализация которой представлена объектным файлом)" или "юзай такой-то табличный процессор". Вот если бы я создал тред в "болтовне" или в одном из форумов "Веб-программирования" - то дело другое.

Без претензий, ещё раз спасибо, что уделили время.

jimon 25.07.2012 00:30

Ответ: URL в теле страницы
 
impersonalis
это веб детка ! тут могут дать в еб... javascript ! представь себе что на тексте висит выделение по наведению курсора через css, а клик и переход делается через javascript, оно как ссылка, ай и не ссылка ! Where is Your God Now ? :crazy:

ps. html5

impersonalis 25.07.2012 00:33

Ответ: URL в теле страницы
 
Это указано: нужны только "явные" (не знаю, какой терминологически верно) ссылки:
Цитата:

Сообщение от impersonalis (Сообщение 233817)
... но без учёта всяких интегрируемых объектов типа перехода при клике внутри flash-объекта [от которого в HTML останется лишь уопминание]).

Цитата:

Сообщение от impersonalis (Сообщение 233971)
...Думал регэксп использовать чтоб забраковать href-ы содержащие ссылки, получаемые в результате выполнения скрипта (т.е. не содержащие ссылки в явном виде).


moka 25.07.2012 00:35

Ответ: URL в теле страницы
 
Цитата:

Сообщение от impersonalis (Сообщение 234178)
хх: здравствуйте, научите меня делить столбиком. Правильно ли я делаю: (пример деления двух чисел)
yy: бери калькулятор
zz: бери MATLAB

Брать C++ для таких вещей - это, как Assembler или MATLAB для того что ты спрашивал.

То что я предложил, на серверной стороне - есть самый оптимальный и минимальный вариант. То что предложил АВТО - это самый нормальный и оптимальный вариант для фронт-енда, если тебе нужно тупо получить результат сразу.
А юзать С++ для таких вещей - это полный изврат. Если ты знаешь С++, и не знаешь других инструментов, может всё таки стоит попробовать что-то ещё, более заточенное под конкретную нужду?

Плюс, ты спросил вопрос про веб, где 95% решений будет именно в виде javascript'а, т.к. ты не указал если тебе это нужно на backend стороне, следственно для таких задачей самое разумное это JS на фронтенде.

Это не алгоритм сортировки.
Да даже предложить регулярные выражения тогда по такой логике нельзя - т.к. не во всех языках есть с коробки, и нужны либы.

jimon 25.07.2012 00:36

Ответ: URL в теле страницы
 
impersonalis
будь уверен - внутри <a ... href - ссылка, но ! а что вместо ссылки там javascript ?! (это тот который в адресной строке выполнится) :crazy: Where is Your God Now ? :crazy:

impersonalis 25.07.2012 00:50

Ответ: URL в теле страницы
 
2jimon

Цитата:

забраковать href-ы содержащие ссылки, получаемые в результате выполнения скрипта (т.е. не содержащие ссылки в явном виде).
2MoKa
я понял, и написал выше:
Цитата:

Сообщение от impersonalis (Сообщение 234113)
Но, видать, овчинка выделки не стоит.

Просто уточнил ваши предположения.
зыж нет цпп мои познания не ограничиваются.

moka 25.07.2012 00:54

Ответ: URL в теле страницы
 
Угу, такое бывает.
PHP код:

<a href="javascript:alert('clicked');">link</a

Заместо alert'а, можно сделать window.location... и тогда будет перенаправление.
Также можно сделать <div onclick="..." ... и там в скрипте открывать ссылки тоже.
Также есть ajax, где данные не статичны, и тупо получая разметку из исходника - недостаточно, т.к. DOM динамически генерируется скриптом, пример: facebook, twitter, и многие другие.

Да и предлагать С++ для таких вещей - это как ассемблер или матлаб для деления в столбик. А node для серверного парсинга html'а - это как раз прямой и самый адекватный вариант для серверной стороны. Либо js для фронтенда (ну тут без вариантов) также самый нормальный и прямой способ.

impersonalis 25.07.2012 00:56

Ответ: URL в теле страницы
 
У меня складывается ощущение, что вы обсуждаете не мою, а свои проблемы.

ОТВЕТ НА МОЙ ВОПРОС (в первом посте): "нет, твой ублюдский алгоритм не учитывает всех тонкостей. Алгоритм, работающий корректно, слишком сложен, чтобы его объяснить тут на пальцах" (мои посты, похоже в приципе не отображаются, и участники обсуждают мысли друг друга).

Просьба закрыть тему.

ABTOMAT 25.07.2012 01:04

Ответ: URL в теле страницы
 
Цитата:

Сообщение от jimon (Сообщение 234184)
impersonalis
будь уверен - внутри <a ... href - ссылка, но ! а что вместо ссылки там javascript ?! (это тот который в адресной строке выполнится) :crazy: Where is Your God Now ? :crazy:

Еслир там жаба то легко отличить: она начинается с javascript:
А вообще тому кто так верстает надо дать по щам.

Randomize 25.07.2012 01:15

Ответ: URL в теле страницы
 
Цитата:

Сообщение от impersonalis (Сообщение 234064)
Если я применю этот регэксп целиком к телу, то получу просто false, не так ли? На что опираться выбирая разделители для нарезки тела на потенциальные ссылки?

Цитата:

#<a\s[^>]*href=\"([^\"]*)\"[^>]*>(.*)<\/a>#siU
Нет ^ и $ то есть нет чёткого ограничения для регулярки. Она гуляет по всему тексту с рекурсией. (см мой мини учебник)
Обрати внимание на круглые скобки. Всё что в них выплюнется в результат.

Тобеж для каждого найденного будет:
0) полная строка по шаблону. Например: <a href="http://popka/">ссылка</a>
1)<a href="{текст отсюда}"></a>
2)<a href="">{и текст отсюда}</a>

Цитата:

Сообщение от jimon (Сообщение 234184)
impersonalis
будь уверен - внутри <a ... href - ссылка, но ! а что вместо ссылки там javascript ?! (это тот который в адресной строке выполнится) :crazy: Where is Your God Now ? :crazy:

Будь уверен что после получения html кода и запуска JS DOM уже не будет прежним. Чёрт побери, да современная веб страница перестраивает себя зачастую чуть ли не на 50% в процессе работы.

jimon 25.07.2012 03:30

Ответ: URL в теле страницы
 
Цитата:

Сообщение от ABTOMAT (Сообщение 234194)
Еслир там жаба то легко отличить: она начинается с javascript:
А вообще тому кто так верстает надо дать по щам.

можно долго рассуждать кому надо давать по щам, но как только появляется заказчик с кучей денег, то на любой проект связанный с "сделайте что-то для интернета" (скажем связанное с топиком - граббер ссылок) приходится отвечать нет, ибо ВСЕГДА найдется пидо..идиот с супер кривым сайтом о котором знает только заказчик :crazy:

ABTOMAT 25.07.2012 03:31

Ответ: URL в теле страницы
 
Цитата:

Сообщение от jimon (Сообщение 234208)
можно долго рассуждать кому надо давать по щам, но как только появляется заказчик с кучей денег, то на любой проект связанный с "сделайте что-то для интернета" (скажем связанное с топиком - граббер ссылок) приходится отвечать нет, ибо ВСЕГДА найдется пидо..идиот с супер кривым сайтом о котором знает только заказчик :crazy:

Несколькими постами выше я как раз писал о том, что в Интернетах пишут кто как хочет и так или иначе придётся это учитывать.
А по щщам давать всё равно надо.

impersonalis 25.07.2012 23:26

Ответ: URL в теле страницы
 
Спасибо, что закрыли тему, а не продолжили обсуждать свои взгляды.


Часовой пояс GMT +4, время: 12:59.

vBulletin® Version 3.6.5.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot