![]() |
eXeL@B —› Вопросы новичков —› Люди просто интересно ... как устроена Поисковая система ??? |
Посл.ответ | Сообщение |
|
Создано: 11 октября 2006 02:30 · Личное сообщение · #1 |
|
Создано: 11 октября 2006 03:24 · Личное сообщение · #2 |
|
Создано: 11 октября 2006 05:32 · Личное сообщение · #3 |
|
Создано: 11 октября 2006 11:03 · Личное сообщение · #4 |
|
Создано: 12 октября 2006 00:43 · Личное сообщение · #5 QuZ пишет: может ктонить подробнее расскажет как это делает Универсальным справочником является Интернет, а краклаб. Если вкратце: 1) Составляется словарь слов для поиска 2) Просматриваются по возможности "все страницы всех серверов в мире" и индексируются по словарю есть или нет слово на странице. Как строится индекс для поиска фраз - не знаю, наверное что-то типа метрики вводится. 3) Уже давно добавлен механизм расширения словаря : если кто-то умудрится даже самое неправильное слово раз сто вбить при поиске - оно заносится в словарь. 4) Пункты 2 и 3 повторяются 24 часа в сутки, 7 дней в неделю. 5) Есть договоренность, что файлы и папки перечисленные в файле robots.txt не индексируются 6) Все поисковики стараются под видом вашей пользы всучить вам "бар", который собирает имена серверов по которым вы ходите и им повышается приоритет индексации. Раз люди ходят - значит еще кому-то будет полезно. Конечно поисковики не забывают своих спонсоров и всячески стараются вас заманить на их сервера, наверняка иногда подсовывая их в список найденных или рисуя рядом с найденными ![]() И никаких чудес, только куча-куча вложенных миллиардов и куча-куча прибыли( при удаче ![]() ![]() |
|
Создано: 13 октября 2006 05:54 · Личное сообщение · #6 |
|
Создано: 13 октября 2006 09:22 · Личное сообщение · #7 |
|
Создано: 13 октября 2006 11:27 · Поправил: NEOPEX · Личное сообщение · #8 |
|
Создано: 15 октября 2006 01:36 · Личное сообщение · #9 |
|
Создано: 15 октября 2006 02:27 · Личное сообщение · #10 |
|
Создано: 15 октября 2006 08:44 · Личное сообщение · #11 |
|
Создано: 16 октября 2006 07:22 · Личное сообщение · #12 QuZ пишет: я просто хочу для себя поэксперементировать что с этим может выйти... всеж нэт почти бесплтный да и места навалом Если заниматься по серьезному, то ты вылетишь в трубу - трафик будет немерянный. И место быстро кончится. Поставь себе апач и MySql - там в примерах скриптов наверняка что-то похожее есть. Ищи движок поиковика. Вот что-то близкое, но немного не то : softsearch.ru/articles/7-540-read.shtml ![]() |
|
Создано: 16 октября 2006 12:17 · Личное сообщение · #13 |
|
Создано: 17 октября 2006 01:26 · Личное сообщение · #14 QuZ пишет: Классно быть всеж провайдером Это другое дело. Тогда "зебра" для тебя. Это не совсем поисковик - мета поисковик, т.е. ищет по "готовенькому". Но для привлечения клиентов на хостинг вполне годится. Есть и обратная проблема : как "засветить" сайты на поисковиках. Для этого есть туторы и коммерческие предложения. ![]() |
|
Создано: 17 октября 2006 14:07 · Личное сообщение · #15 |
|
Создано: 22 октября 2006 05:09 · Личное сообщение · #16 |
|
Создано: 22 октября 2006 05:13 · Личное сообщение · #17 tundra37 пишет: Конечно поисковики не забывают своих спонсоров и всячески стараются вас заманить на их сервера, наверняка иногда подсовывая их в список найденных или рисуя рядом с найденными Я тоже заметил,что иногда вперемешку с "нормальными" страницами вылазит всякая дрянь, вплоть до порносайтов (это на Яндексе то....) tundra37 пишет: 2) Просматриваются по возможности "все страницы всех серверов в мире" и индексируются по словарю Такое даже гипотетически трудно представить.Скорее всего есть определённый "список" сайтов, на которых идёт поиск. И чтобы вновь испечённый сервак был занесён в "индекс",надо очевидно производить некий набор действий... я к тому что само по себе ничего не происходит в мире ![]() |
|
Создано: 24 октября 2006 03:32 · Поправил: tundra37 · Личное сообщение · #18 DrOcHuN пишет: Я тоже заметил,что иногда вперемешку с "нормальными" страницами вылазит всякая дрянь, Это связано с "грязными технологиями". На страницу помещается список самых "поисковых строк" и в результате искать на яндексе стало невозможно. На yahoo проще найти рускоязычные страницы, т.к. там это отфильтровывается. Скорее всего есть определённый "список" сайтов, Но дальше строится дерево ссылок и оно вполне демократичное. Я находил документы и файлы на фтп-серверах явно не предназначенные для поиска всемирным сообществом и явно не нуждающиеся в индексации. Просто поисковик обнаружил свое "любимое слово" внутри Линуксового экзешника, например ![]() А уж индексация "закрытых" страниц - это особая песня. Я, например, нашел и скачал тексты программ, к которым не было ссылок с самого сайта, но были ссылки из поисковика ! ![]() |
|
Создано: 25 октября 2006 07:16 · Личное сообщение · #19 DrOcHuN[u][/u] Вообщето я написал - ПОЧТИ БЕСПЛАТНЫЙ ..... А во вторых , если ты не знаешь То при покупке большого лолличества трафика - 100- 200 терабайт , 1 гиг стоит 10 центов..... А терабайт выходит в 100 вечнозеленых.... А еще остается к концу месяца траф , который оплатили пользователи за месяц , но не использовали... И со следующего месяца можно его использовать.... Так что незаконного тут мало что... Благодарю... Только вот интересно что-нить более конкретное о поисковой системе....... За помощь буду благодарен.... ![]() |
|
Создано: 26 октября 2006 05:14 · Поправил: tundra37 · Личное сообщение · #20 QuZ пишет: что-нить более конкретное о поисковой системе Времена программистов одиночек, по крайней мере в области Интернета, давно уже канули в лету. Используется , я ее условно назову, крупноблочная система : есть готовые реализации запроса страниц, есть готовые проги для баз данных с индексацией и поиском. Садится программист прошедший 2-х недельные курсы и ваяет поисковую систему из этих блоков ![]() ![]() =========================== Чтобы тебе стало ясно : почитай описание формата для HTML. Вот все что там есть, тебе придется анализировать на странице, плюс скрипты, java всяческая и т.д. Не страшно - тогда реши эту задачу. После этого я расскажу, что такое базы и индексы. Но на самом деле, если ты ее решишь эффективно, то ты обеспеченный профи до конца своих дней ![]() ![]() |
|
Создано: 30 октября 2006 10:05 · Личное сообщение · #21 Спасибо.....Классно написал... ![]() ![]() А вот насчет одиночек- ты прав... ![]() *лин , нажда должна помирать последней........ ![]() |
|
Создано: 31 октября 2006 04:47 · Личное сообщение · #22 |
|
Создано: 01 ноября 2006 10:05 · Личное сообщение · #23 |
|
Создано: 02 ноября 2006 04:41 · Личное сообщение · #24 QuZ Повторяю, на sourceforge есть группы разработчиков, их много и русские тоже есть. А форумы естественно в другом месте. Задаешь поиск, заходишь на форум и определяешься - подходит, не подходит. В конце концов задай здесь поиск со словом исходники - достаточно часто туда отсылают или просто спроси ![]() ![]() |
|
Создано: 05 ноября 2006 11:17 · Личное сообщение · #25 QuZ пишет: Только вот интересно что-нить более конкретное о поисковой системе А что поискать на Рамблере не судьба? Не думаю что здесь есть спецы в этом деле. Такие вещи ИМХО только спамерам интересны,чтобы знать куда и что рассылать,так чтобы по шапке потом не получить. QuZ пишет: при покупке большого лолличества трафика - 100- 200 терабайт , 1 гиг стоит 10 центов..... А терабайт выходит в 100 вечнозеленых.... бред какой-то Кто будет покупать столько траффика и где его хранить? ![]() |
|
Создано: 06 ноября 2006 06:15 · Личное сообщение · #26 |
|
Создано: 08 ноября 2006 13:06 · Личное сообщение · #27 Ну вообщето сам качаю и с меня скачивают по 400-500 гигов месяц.... А хранить трафик то за-что ? он не умирает..А вот юзеры тоже покупают трафик да и не в малом колличестве.. на дом в среднем уходит около 700 гигов месяц.... И кстати еще.. тема другая - не искать где дешевле нет и сколько его брать , наверно сам разберусь ![]() ![]() ![]() |
|
Создано: 09 ноября 2006 09:03 · Личное сообщение · #28 |
|
Создано: 10 ноября 2006 14:40 · Личное сообщение · #29 |
|
Создано: 11 ноября 2006 03:24 · Личное сообщение · #30 |
![]() |
eXeL@B —› Вопросы новичков —› Люди просто интересно ... как устроена Поисковая система ??? |