Сейчас на форуме: jinoweb, bartolomeo (+5 невидимых)

 eXeL@B —› Программирование —› Парсер ссылок в файле
<< . 1 . 2 .
Посл.ответ Сообщение


Ранг: 107.3 (ветеран), 5thx
Активность: 0.20.04
Статус: Участник

Создано: 02 ноября 2008 12:39 · Поправил: Модератор
· Личное сообщение · #1

Ситуация такая:
В моём The Bat! в одом из ящиков лежит много писем примерно одинакого содержания.
В каждом(или почти в каждом) письме есть ссылка. У всех ссылок есть одинаковый участок.
К примеру:
хттп://ввв.гугл.ру/hgurnRjrk141246
хттп://ввв.йа.ру/hgurnRjrk516483
Вот жирным выделены одинаковые участки.
Задача состоит в том чтобы собрать все эти ссылки.
З.Ы. Если не в том форуме создал то переместите =)



Ранг: 516.1 (!), 39thx
Активность: 0.280
Статус: Участник

Создано: 19 февраля 2009 08:00
· Личное сообщение · #2

Getorix, эти библиотеки начиная с win95/98 есть, без них ie не работает, работоспособность проверена




Ранг: 756.3 (! !), 113thx
Активность: 0.610.05
Статус: Участник
Student

Создано: 28 апреля 2010 01:41 · Поправил: Isaev
· Личное сообщение · #3

Вариант 1:
Code:
  1. tans[1] = '<p>Слово1<span>Клон: <b>Слово2</b></span></p>';

Вариант 2:
Code:
  1. tans[1] = '<p>Слово1</p>';


Выход:
R.Match[1]=цифра в квадратных скобках
R.Match[2]=Слово1
R.Match[3]=Слово2 (или пустая строка при варианте 2)

Возможно это написать в одно выражение? В 2 без проблемм, но чувствуется, что в одно тоже можно

-----
z+Dw7uLu5+jqLCDq7vLu8PvpIPHs7uMh




Ранг: 57.1 (постоянный), 3thx
Активность: 0.040
Статус: Участник

Создано: 28 апреля 2010 11:04
· Личное сообщение · #4

У меня была идея плагина к Hiew, в котором бы прикрутил PCRE-совместимые регулярки. Цель плагина была бы отобразить строки в файле, которые попадают под регулярки написанные в ini-файле. Можно было бы вынести и поиск ссылок, и поиск уникальных для конкретного вида работ строки ;)

Возникает вопрос: нужен ли подобный плаг ?



Ранг: 20.8 (новичок), 7thx
Активность: 0.010.02
Статус: Участник

Создано: 28 апреля 2010 13:33
· Личное сообщение · #5

cat, grep, perl .... зачем еще изобретать велосипеды?



Ранг: 57.1 (постоянный), 3thx
Активность: 0.040
Статус: Участник

Создано: 28 апреля 2010 13:53
· Личное сообщение · #6

int_256за тем чтобы не отходя от кассы! т.е. не отвлекаясь на другие тулзы, увидел, принял решение и дальше реверсишь )




Ранг: 756.3 (! !), 113thx
Активность: 0.610.05
Статус: Участник
Student

Создано: 28 апреля 2010 23:08 · Поправил: Isaev
· Личное сообщение · #7

писатели плагинов, помогли бы лучше с решением
По идее должно быть осуществимо, в виду возможности искать 0 или больше вхождений...

-----
z+Dw7uLu5+jqLCDq7vLu8PvpIPHs7uMh




Ранг: 1.0 (гость)
Активность: 0=0
Статус: Участник

Создано: 18 февраля 2017 21:41
· Личное сообщение · #8

если кому надоело руками парсить текст . появилась программа Mailhunter (URL Parser)

Добавлено спустя
Программа MailHunter (URL Parser) предназначена для поиска и извлечения URL-адресов в файлах: Входящими файлами могут быть текстовые файлы, например *.txt, файлы Microsoft Word (*.doc, *.docx, *.docm) и файлы Microsoft Excel (*.xls, *.xlsx, *.xlsm). Содержимое этих файлов - текст вперемежку с URL-ссылками.


<< . 1 . 2 .
 eXeL@B —› Программирование —› Парсер ссылок в файле
Эта тема закрыта. Ответы больше не принимаются.
   Для печати Для печати