Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Работа для программиста > Фриланс
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 19.04.2010, 16:16   #1
8axa
Новичок
Джуниор
 
Регистрация: 19.04.2010
Сообщений: 0
По умолчанию Требуется программист - разработка краулера

Требуется программист, срочно!

Задача - написание поискового краулера (веб) с определенным набором функций.

Читаем приблизительное ТЗ ниже, и если - "да", то стучим в асю 440-666-303, заранее подготовив предложения по цене и срокам.

ТЗ.

Требуется программа которая будет собирать, проверять на доступность, и заносить в базу ссылки со страниц сайта.

Описание работу краулера.

1. Пользователь дает программе URL или список урлов - пример -> http://*.site.ru, где * - поддомен. Или http://*.site.ru/раздел/# - где # - диапазон страниц (1-20, например). Так же будут страницы в динамике, скорее всего php.
2. Программа собирает все ссылки по заданной маске.
3. Переходит по каждой ссылке удовлетворяющей маске.
4. В зависимости от результата перехода помещает ссылку в нужный раздел. Например - not_found, timeout, и тд.
5. Выводит результаты в удобоваримой форме, напрмиер лист Excel.

PS - возможно, первоначальный функционал немного расширится.

Всем откликнувшимся заранее спасибо. О результатах отбора сообщу в этой ветке.
8axa вне форума Ответить с цитированием
Старый 19.04.2010, 16:53   #2
AlDelta
Реанимируюсь...
Участник клуба
 
Аватар для AlDelta
 
Регистрация: 19.07.2007
Сообщений: 1,445
По умолчанию

Отписался...
Пишите код так, как будто сопровождать его будет склонный к насилию психопат, который знает, где вы живёте.
Правила форума => Правила раздела => Для общего развития => Помощь студентам => Перед тем, как создавать тему, скачайте себе...
P.S.: форум не песочница (с)
название статьи на сайте MS: "Отмена принудительного отключения автоматического запуска в реестре Windows"
AlDelta вне форума Ответить с цитированием
Старый 19.04.2010, 20:12   #3
motorway
Участник клуба
 
Регистрация: 28.06.2009
Сообщений: 1,950
По умолчанию

Написал вам
motorway вне форума Ответить с цитированием
Старый 19.04.2010, 21:09   #4
Neobrat
Форумчанин
 
Регистрация: 10.12.2007
Сообщений: 124
По умолчанию

ребят, меня проект не интересует, вот заинтересовал только одним моментом.

вот url http://*.site.ru
как узнать его все имееющиеся поддоменны!?
первая мысль это пробежать по поисковикам например погуглить
но блин inurl:*.site.ru даст хреново тучу адресов которые не обязаны принадлежать site.ru.
Да и при том могут имееться не индексируемые полностью поддоменны.
т.е. некоторые можем потерять.
Whois не дает такой информации.
Тупым перебором не взять.. это же сколько можно потратить время бестолку если домен не содержит под доменны..

Так каким образом узнать все существующие поддоменны определеного домена?
Русский язык не мой конёк
Neobrat вне форума Ответить с цитированием
Старый 20.04.2010, 10:12   #5
xNut
 
Аватар для xNut
 
Регистрация: 16.06.2009
Сообщений: 8
Радость

Цитата:
Сообщение от Neobrat Посмотреть сообщение
Так каким образом узнать все существующие поддоменны определеного домена?
Вы правы, тут автор зря обнадёживается
А все остальное вполне выполнимо
Стучите в ICQ, могу сделать
xNut вне форума Ответить с цитированием
Старый 20.04.2010, 11:36   #6
8axa
Новичок
Джуниор
 
Регистрация: 19.04.2010
Сообщений: 0
По умолчанию

Господа программисты!

Несколько уточнений.
1. Нужна программа (.exe), скрипты, готовые или свеженаписанные не предлагать!
2. Стучитесь или высказывайтесь в топике по делу, не нужно стучать в асю и задавать "еврейские" вопросы.
3. Есть бесплатное приложение - XENU. Не поленитесь, скачайте и разберитесь в ТЗ.

Задавайте вопросы, я с удовольствием на них отвечу здесь или в асе, но - ПО ДЕЛУ!
8axa вне форума Ответить с цитированием
Старый 20.04.2010, 11:44   #7
8axa
Новичок
Джуниор
 
Регистрация: 19.04.2010
Сообщений: 0
По умолчанию

Цитата:
Сообщение от Neobrat Посмотреть сообщение
ребят, меня проект не интересует, вот заинтересовал только одним моментом.

вот url http://*.site.ru
как узнать его все имееющиеся поддоменны!?
первая мысль это пробежать по поисковикам например погуглить
но блин inurl:*.site.ru даст хреново тучу адресов которые не обязаны принадлежать site.ru.
Да и при том могут имееться не индексируемые полностью поддоменны.
т.е. некоторые можем потерять.
Whois не дает такой информации.
Тупым перебором не взять.. это же сколько можно потратить время бестолку если домен не содержит под доменны..

Так каким образом узнать все существующие поддоменны определеного домена?
В данном случае ничего не нужно искать и гуглить.
Задача программы - проследовать по всем ссылкам уже имеющимся на странице, и попадающих под опредленную маску (*.site.ru).
8axa вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Требуется разработка программы для автоматической подачи объявлений на сайты. fine09 Фриланс 4 25.10.2013 16:02
Требуется разработка ПО 99ml Фриланс 6 20.02.2010 21:02