Сейчас на форуме: jinoweb, bartolomeo, rmn (+4 невидимых) |
eXeL@B —› Программирование —› C++ - получить код html-страницы |
Посл.ответ | Сообщение |
|
Создано: 28 мая 2014 18:45 · Поправил: Crawler · Личное сообщение · #1 Суть вопроса в следующем: пишу парсер выдачи Google, пока добрался только до получения html-страницы по запросу. Пробую получить при помощи функций из ws2_32.lib (OpenURL и т.д). Естественно, вместо нормальной выдачи получаю страницу с кучей javascript-функций. А хочется, чтобы в выдаче была именно страница с результатами поискового запроса. Может быть, есть где-то примеры, на которые можно ориентироваться? Вроде бы, это можно сделать с помощью CppWebBrowser, но не нашел примеров именно с получением кода динамической веб-страницы. В программировании под веб я полный ноль, так что буду благодарен за любую помощь и - особенно - за примеры (если можно, то без GUI, просто хочется получить код страницы куда-нибудь в строковую переменную) Заранее спасибо. Кому интересно, код, который нашел и использую сейчас я, выглядит так: Code:
----- Харе курить веники и нюхать клей, к вам едет из Америки бог Шива, и он еврей. |
|
Создано: 28 мая 2014 19:07 · Личное сообщение · #2 Посмотрите в сторону Google Web Search API https://developers.google.com/web-search/docs/ Раздел: Flash and other Non-Javascript Environments Там пишут, что он устарел, и его не рекомендуют использовать. Но пока работает. | Сообщение посчитали полезным: Crawler |
|
Создано: 28 мая 2014 19:07 · Личное сообщение · #3 НА цпп сам перепишешь Code:
----- xchg dword [eax], eax | Сообщение посчитали полезным: Crawler |
|
Создано: 28 мая 2014 19:08 · Поправил: deniskore · Личное сообщение · #4 Если не принципиально используйте Wininet Вот запрос погоды у яндекса. Code:
| Сообщение посчитали полезным: Crawler |
|
Создано: 28 мая 2014 19:13 · Личное сообщение · #5 http://stackoverflow.com "C++ requires a little more work then other languages. You will need to connect to Google's REST Search API(https://developers.google.com/web-search/docs/?csw=1#fonje) and then use a JSON parser to parse out the search results. Json.org (http://www.json.org/) has a collection of JSON parsers in various languages." |
|
Создано: 28 мая 2014 19:51 · Личное сообщение · #6 |
|
Создано: 28 мая 2014 20:54 · Личное сообщение · #7 |
|
Создано: 28 мая 2014 21:25 · Личное сообщение · #8 |
|
Создано: 28 мая 2014 23:16 · Личное сообщение · #9 |
|
Создано: 29 мая 2014 10:17 · Поправил: Crawler · Личное сообщение · #10 Не ожидал столько ответов! Всем благодарен за помощь, плюсану после лимита) Не малварь, ищу специфические серваки. Если у кого-то будут ещё идеи, лишним не будет) * Решил пока попользоваться вариантом INT (с QT уже имел дело, хотя и не так плотно). Но попробую все варианты - чисто ради интереса) UPD2: всем большое спасибо еще раз! Ушел разбираться с QT - это, видимо, надолго. Кстати, вариант deniskore сработал, только поменял в заголовках content-type и еще парочку параметров. Ну, и тип запроса на GET. =) ----- Харе курить веники и нюхать клей, к вам едет из Америки бог Шива, и он еврей. |
|
Создано: 30 мая 2014 17:13 · Личное сообщение · #11 Crawler просил без GUI Я, например, использовал cURL - это по сути браузер для работы через командную строку. Программа поддерживает протоколы: FTP, FTPS, HTTP, HTTPS, TFTP, SCP, SFTP, Telnet, DICT, File: , LDAP а также POP3, IMAP и SMTP. Также cURL поддерживает сертификаты HTTPS, методы HTTP POST, HTTP PUT, загрузку на FTP, загрузку через формы HTTP. писал программу, которая генерила нужные мне команды работы с веб-серверами, т.к. cURL выводит результат в stdout я создавал пайп для перенаправления стандартного вывода и потом уже парсил результат, как хотел. Если вывода относительно мало можно вывод перенаправлять в файл и работать с файлом, но это долго, если генеришь тысячу страниц... |
|
Создано: 30 мая 2014 17:22 · Личное сообщение · #12 saffers пишет: писал программу, которая генерила нужные мне команды работы с веб-серверами, т.к. cURL выводит результат в stdout я создавал пайп для перенаправления стандартного вывода и потом уже парсил результат, как хотел. Вот это извраааат........ OLE не канает ? Попробуй в таких случая воспользоваться Учим архитектуру |
eXeL@B —› Программирование —› C++ - получить код html-страницы |