Сейчас на форуме: (+5 невидимых)

 eXeL@B —› Программирование —› Обработка html страницы до её показа
Посл.ответ Сообщение

Ранг: 13.9 (новичок)
Активность: 0=0
Статус: Участник

Создано: 30 октября 2007 07:50
· Личное сообщение · #1

Привет всем. Недавно скачал довольно-таки неплохую программу Ad Muncher для срезки рекламы с сайтов, стало интересно как сделать такое самому: то есть перехват и обработку страниц до их показа в браузере.
В поиске пробовал искать по запросу "обработка html", но ничего так и не нашёл. Есть какие-нибудь идеи или примеры?

(Если будете давать код, то желательно для Delphi\C++)



Ранг: 29.8 (посетитель)
Активность: 0.020
Статус: Участник

Создано: 30 октября 2007 09:37 · Поправил: Grom_
· Личное сообщение · #2

походу нужно перехватывать функции для работы с сетью , все равно данные от туда летят.
+ знать что именно хватать(для кого приложения), не все же шерстить.

А в полученных байтах вырезать байты рекламы, и передовать это дальше в брайзер.

ЗЫ нуно смотреть как устроенно обращение к сетевым функциям, и по возможности поставить функции "прокладки" (поправив Импорт у браузера).

ЗЫЗЫ чето типо ....



Ранг: 309.8 (мудрец), 21thx
Активность: 0.170
Статус: Участник

Создано: 30 октября 2007 14:01 · Поправил: SLV
· Личное сообщение · #3

хук InternetReadFile и не давай маленьким страницам кешироваться, ещё gzip отключай в хидерах..
[added]
да, это всё касательно IE, другими браузерами не интересовался. а вообщем законный метод тут COM тоесть BHO. на rsdn есть статья тока ком это ппц) а так где-то есть сорцы формграббера на этой технологии от автора первого пинча. там пример работы ;)

-----
Shalom ebanats!




Ранг: 42.1 (посетитель)
Активность: 0.020
Статус: Участник

Создано: 30 октября 2007 14:12
· Личное сообщение · #4

а) твоя прога работает как прокси-сервер, в установках браузера ставишь "Use proxy server". Универсальный способ, пригоден для всех браузеров. Немного сложновато сделать качественный прокси-сервер. (пример - Proxomitron)
б) твоя прога регистрируется как Browser Helper Object. Работает только для IE. Самый лёгкий путь.
в) твоя прога ставит перехваты на функции для работы с сетью. Трудно, потому что сам должен собирать HTML из сетевых пакет, обрабатывать а потом менять пакети.
г) используешь COM, DLL инжекты или какие ещё более извращённые методы. Для мазохистов.




Ранг: 1131.7 (!!!!), 447thx
Активность: 0.670.2
Статус: Участник

Создано: 30 октября 2007 14:25 · Поправил: Gideon Vi
· Личное сообщение · #5

Lakmus пишет:
стало интересно как сделать такое самому: то есть перехват и обработку страниц до их показа в браузере


дык. локальный прокси. ты посмотри в своём браузере, какой у него теперь прокси прописан (после установки Ad Muncher).

Lakmus пишет:
Недавно скачал довольно-таки неплохую программу Ad Muncher


Теперь посмотри proxomitron - думаю, что понравится гораздо больше.



Ранг: 72.3 (постоянный)
Активность: 0.040
Статус: Участник

Создано: 30 октября 2007 15:08
· Личное сообщение · #6

простой формграббер который парсит страницы тут hххp://rapidshare.com/files/66235381/8734782772345723475.rar.html
пасс - form_grab



Ранг: 13.9 (новичок)
Активность: 0=0
Статус: Участник

Создано: 30 октября 2007 16:45
· Личное сообщение · #7

спасибо всем за ответы. В общем, я думаю стоит использовать способ с локальным прокси. Нашёл очень компактный пример ZEN Anonymous proxy server на wasm.ru, (http://www.wasm.ru/src/5/zproxy.zip) сейчас сяду его разбирать.

Gideon Vi
Теперь посмотри proxomitron - думаю, что понравится гораздо больше.
спасибо за совет, посмотрел понравилось то что он бесплатный и вроде неплохо настраивается, думаю буду использовать его, если свой не получится написать. Дело в том, что с Ad Muncher'ом комп часто влетает в bsod, поэтому использовать нереально.

просьба модераторам пока не закрывать тему, возможно появятся ещё вопросы.




Ранг: 1131.7 (!!!!), 447thx
Активность: 0.670.2
Статус: Участник

Создано: 31 октября 2007 03:04
· Личное сообщение · #8

Lakmus пишет:
спасибо за совет, посмотрел


угу, всегда пожалуйста. тут http://www.proxomitron.ru/board/ русский форум - можно качать их сборки



Ранг: 13.8 (новичок), 1thx
Активность: 0.010
Статус: Участник

Создано: 31 октября 2007 08:11
· Личное сообщение · #9

Internet JUNKBUSTER 2.0.2
_http://www.junkbusters.com/ijb.html
_http://www.junkbusters.com/ijb20.zip
На основе прокси-сервера, с исходниками.




Ранг: 536.4 (!), 171thx
Активность: 0.660.13
Статус: Администратор
Создатель CRACKL@B

Создано: 31 октября 2007 11:13
· Личное сообщение · #10

Lakmus пишет:
Дело в том, что с Ad Muncher'ом комп часто влетает в bsod

Спорное утверждение. Кстати если в ад мунхере (или хз) сделать такую фишку: замена "hidden" на "text", то на многих сайтах и форумах можно много еще чего интересного увидеть.

-----
Всем не угодишь




Ранг: 13.9 (новичок)
Активность: 0=0
Статус: Участник

Создано: 02 ноября 2007 07:44
· Личное сообщение · #11

дописал рабочий пример HTTP прокси. В общем, сейчас он грузит страницы и заменяет все буквы "у" на "ф" к сожалению, это задевает и байты рисунков, но для теста пока сойдёт, этот баг нетрудно поправить. Оказалось всё не так уж и сложно, если использовать локальный прокси, и не пришлось сидеть разбираться с COM и т.п.

Если кому-нибудь нужно, то в аттаче (25 кб) написанные мною исходные коды HTTP прокси для Delphi 2006. Для работы настройте прокси в браузере на localhost:3128. Извиняюсь за некоторый беспорядок в коде, это черновой вариант

Спасибо всем за обсуждение, тему, думаю, можно уже закрыть т.к. ответ на вопрос темы получен.

3695_01.11.2007_CRACKLAB.rU.tgz - http_proxy_src.rar


 eXeL@B —› Программирование —› Обработка html страницы до её показа
:: Ваш ответ
Жирный  Курсив  Подчеркнутый  Перечеркнутый  {mpf5}  Код  Вставить ссылку 
:s1: :s2: :s3: :s4: :s5: :s6: :s7: :s8: :s9: :s10: :s11: :s12: :s13: :s14: :s15: :s16:


Максимальный размер аттача: 500KB.
Ваш логин: german1505 » Выход » ЛС
   Для печати Для печати