Сейчас на форуме: (+5 невидимых) |
eXeL@B —› Программирование —› Обработка html страницы до её показа |
Посл.ответ | Сообщение |
|
Создано: 30 октября 2007 07:50 · Личное сообщение · #1 Привет всем. Недавно скачал довольно-таки неплохую программу Ad Muncher для срезки рекламы с сайтов, стало интересно как сделать такое самому: то есть перехват и обработку страниц до их показа в браузере. В поиске пробовал искать по запросу "обработка html", но ничего так и не нашёл. Есть какие-нибудь идеи или примеры? (Если будете давать код, то желательно для Delphi\C++) |
|
Создано: 30 октября 2007 09:37 · Поправил: Grom_ · Личное сообщение · #2 походу нужно перехватывать функции для работы с сетью , все равно данные от туда летят. + знать что именно хватать(для кого приложения), не все же шерстить. А в полученных байтах вырезать байты рекламы, и передовать это дальше в брайзер. ЗЫ нуно смотреть как устроенно обращение к сетевым функциям, и по возможности поставить функции "прокладки" (поправив Импорт у браузера). ЗЫЗЫ чето типо .... |
|
Создано: 30 октября 2007 14:01 · Поправил: SLV · Личное сообщение · #3 хук InternetReadFile и не давай маленьким страницам кешироваться, ещё gzip отключай в хидерах.. [added] да, это всё касательно IE, другими браузерами не интересовался. а вообщем законный метод тут COM тоесть BHO. на rsdn есть статья тока ком это ппц) а так где-то есть сорцы формграббера на этой технологии от автора первого пинча. там пример работы ;) ----- Shalom ebanats! |
|
Создано: 30 октября 2007 14:12 · Личное сообщение · #4 а) твоя прога работает как прокси-сервер, в установках браузера ставишь "Use proxy server". Универсальный способ, пригоден для всех браузеров. Немного сложновато сделать качественный прокси-сервер. (пример - Proxomitron) б) твоя прога регистрируется как Browser Helper Object. Работает только для IE. Самый лёгкий путь. в) твоя прога ставит перехваты на функции для работы с сетью. Трудно, потому что сам должен собирать HTML из сетевых пакет, обрабатывать а потом менять пакети. г) используешь COM, DLL инжекты или какие ещё более извращённые методы. Для мазохистов. |
|
Создано: 30 октября 2007 14:25 · Поправил: Gideon Vi · Личное сообщение · #5 Lakmus пишет: стало интересно как сделать такое самому: то есть перехват и обработку страниц до их показа в браузере дык. локальный прокси. ты посмотри в своём браузере, какой у него теперь прокси прописан (после установки Ad Muncher). Lakmus пишет: Недавно скачал довольно-таки неплохую программу Ad Muncher Теперь посмотри proxomitron - думаю, что понравится гораздо больше. |
|
Создано: 30 октября 2007 15:08 · Личное сообщение · #6 |
|
Создано: 30 октября 2007 16:45 · Личное сообщение · #7 спасибо всем за ответы. В общем, я думаю стоит использовать способ с локальным прокси. Нашёл очень компактный пример ZEN Anonymous proxy server на wasm.ru, (http://www.wasm.ru/src/5/zproxy.zip) сейчас сяду его разбирать. Gideon Vi Теперь посмотри proxomitron - думаю, что понравится гораздо больше. спасибо за совет, посмотрел понравилось то что он бесплатный и вроде неплохо настраивается, думаю буду использовать его, если свой не получится написать. Дело в том, что с Ad Muncher'ом комп часто влетает в bsod, поэтому использовать нереально. просьба модераторам пока не закрывать тему, возможно появятся ещё вопросы. |
|
Создано: 31 октября 2007 03:04 · Личное сообщение · #8 |
|
Создано: 31 октября 2007 08:11 · Личное сообщение · #9 |
|
Создано: 31 октября 2007 11:13 · Личное сообщение · #10 |
|
Создано: 02 ноября 2007 07:44 · Личное сообщение · #11 дописал рабочий пример HTTP прокси. В общем, сейчас он грузит страницы и заменяет все буквы "у" на "ф" к сожалению, это задевает и байты рисунков, но для теста пока сойдёт, этот баг нетрудно поправить. Оказалось всё не так уж и сложно, если использовать локальный прокси, и не пришлось сидеть разбираться с COM и т.п. Если кому-нибудь нужно, то в аттаче (25 кб) написанные мною исходные коды HTTP прокси для Delphi 2006. Для работы настройте прокси в браузере на localhost:3128. Извиняюсь за некоторый беспорядок в коде, это черновой вариант Спасибо всем за обсуждение, тему, думаю, можно уже закрыть т.к. ответ на вопрос темы получен. 3695_01.11.2007_CRACKLAB.rU.tgz - http_proxy_src.rar |
eXeL@B —› Программирование —› Обработка html страницы до её показа |