Компьютерный форум NoWa.cc

Компьютерный форум NoWa.cc (https://nowa.cc/index.php)
-   Программирование (https://nowa.cc/forumdisplay.php?f=295)
-   -   сбор поступившей информации с сайта по заданным параметрам (https://nowa.cc/showthread.php?t=430932)

loschilov 04.03.2015 17:30

сбор поступившей информации с сайта по заданным параметрам
 
Интересует есть ли какие-нибудь решения по сбору поступившей информации с сайта по заданным параметрам и отправка найденных данных на почту.

xryun 18.03.2015 06:48

Re: сбор поступившей информации с сайта по заданным параметрам
 
Задача не ясна.
куда поступает информация?Кто её агрегирует?Какие средства используются?
А так бы я взял python-request.Умеет как GET так и POST.А на основе этого можно построить практически любую систему)

loschilov 23.03.2015 07:32

Re: сбор поступившей информации с сайта по заданным параметрам
 
Цитата:

Сообщение от xryun (Сообщение 4931394)
Задача не ясна.

Допустим на сайт поступило три объявления о продаже:
1. слон, стоит 2рубля
2. слон, стоит 1р.
3. слон, стоит 3р.
Нужно из этих объявлений отобрать ценовой диапазон >=2р и отправить их на почтовый ящик.

xryun 24.03.2015 07:00

Re: сбор поступившей информации с сайта по заданным параметрам
 
Цитата:

Сообщение от loschilov (Сообщение 4934086)
объявлений отобрать ценовой диапазон >=2р и отправить их на почтовый ящик

Готовых решений скорее всего нет,но можно так.
1.Выбираем что парсить.Либо весь сайт либо только новые странички.
2.Выдираем данные с сайта.Сохраняем их в переменую(набор переменых).
3.Переменую анализируем с помошью регекспов.Создаем словарики(Питон)|хэши(Руби)|ассоциативные массивы(Пыхапе) где ключи это цена,а значения это текст потенциально письма.
4.В цикле пробегаемся с проверкой по ключам,если цена соответствует критерию - формируем отправку письма.
Вот и весь алгоритм.


Текущее время: 18:32. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2026, vBulletin Solutions, Inc. Перевод: zCarot
Copyright ©2004 - 2026 NoWa.cc

Время генерации страницы 0.01990 секунды с 9 запросами