Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Помощь студентам
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 01.03.2020, 17:22   #1
Илья37
Пользователь
 
Регистрация: 19.02.2020
Сообщений: 46
По умолчанию Как поисковик выводит статьи

Вопрос такой, как поисковик находит определённые статьи если они находятся в базе данных, то есть
почему в поисковике выводится не главная страница сайта а определенные статьи которые пользователь вбивает в поисковик, как он (поисковик например google) определяет что находится в базе данных. возможно вопрос задан не корректно и для кого то тупо но все же.
Илья37 вне форума Ответить с цитированием
Старый 01.03.2020, 23:57   #2
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Поисковик содержит большое число компьютеров которые посещают все сайты в интернете так называемые поисковые сканеры или пауки. Они обходят интернет посещая страницу за страницей. На странице сканер ищет ссылки они всегда начинаются либо с http|https|ftp|www.
Найдя ссылки поисковик складывает ссылки к себе в список помечая которые он уже посетил, а какие ещё нет.

Что касается вычитывание статей из базы данных, то популярные движки сайтов предоставляют API для поисковиков и те ими пользуются. Это ускоряет обход интернета.

Гугл вычитывает весь интернет к себе отсеивает всякий мусор оставляя только текст из статей.
Далее это всё сжимается и хранится в обратном индексе.


Вот тут у меня подборка статей по данной тематике
https://yadi.sk/d/KrHZiJ8nXZpCNw

Из книг:
1) Хараламбос Марманис, Дмитрий Бабенко. - Алгоритмы интеллектуального Интернета
2) Тоби Сегаран. -Программируем коллективный разум
3) Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И.-Технологии анализа данных_ Data Mining, Visual Mining, Text Mining, OLAP_ учебное пособие по специал
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .

Последний раз редактировалось Pavia; 02.03.2020 в 00:08.
Pavia вне форума Ответить с цитированием
Старый 02.03.2020, 02:20   #3
Desc
Участник клуба
 
Аватар для Desc
 
Регистрация: 21.11.2007
Сообщений: 1,063
По умолчанию

Лис,вот это Ты нагрузил. А метаданные тогда для чего втюхиваем?
I am not a wizard, I am just learning.
Desc вне форума Ответить с цитированием
Старый 02.03.2020, 03:26   #4
Alar
Александр
Администратор
 
Аватар для Alar
 
Регистрация: 28.10.2006
Сообщений: 17,534
По умолчанию

Цитата:
Сообщение от Илья37 Посмотреть сообщение
очему в поисковике выводится не главная страница сайта
Поисковику в идеале всё равно какая страница, главная или нет, для него это просто страница.
Alar вне форума Ответить с цитированием
Старый 02.03.2020, 10:25   #5
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Илья37
Забыл сказать. Что для того что-бы поисковик начал индексировать Ваш сайт его надо добавить в поисковик иначе он не будет вас индексировать.

Desc
Цитата:
Сообщение от Desc Посмотреть сообщение
вот это Ты нагрузил. А метаданные тогда для чего втюхиваем?
Согласен, что нагрузил. Перед сном не было было желание расписывать в подробностях.

Вы про тег мета с ключевыми словами? Метаданные поисковик тоже оставляет. Он и картинки анализирует. Я же не уточнил что он считает мусором, а что полезным данными.

Хотя я бы на месте Гугла метеоданные бы выкинул. Так как человек их не видит и ему они бесполезны, а поисковик по большей части сортирует выдачу на основе частных настроек сайта, сделанных в недрах https://g.co/webmasters/ . Это раньше метаданные нужны были для улучшения сортировки при выдачи заменяя собой семантический анализ, а с изобретением алгоритма Word2vec необходимость в них отпала.

В выдаче Яндекса метаданные до сих пор играют важную роль.Только потому что специально обученные человек (SEO-оптимизатор) способен подбирать метаданные лучше чем это делает автоматика. Не хватает мощи Яндексу, а вот у Гугла её полно. И у них с приходом глубинных нейронных сетей всё это может утратить актуальность, если уже не утратило.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 02.03.2020, 11:28   #6
Desc
Участник клуба
 
Аватар для Desc
 
Регистрация: 21.11.2007
Сообщений: 1,063
По умолчанию

Выходит что современному гуглу на то что после тега meta глубоко бобарабану, и он индексирует все содержимое страницы?
I am not a wizard, I am just learning.
Desc вне форума Ответить с цитированием
Старый 02.03.2020, 16:37   #7
Илья37
Пользователь
 
Регистрация: 19.02.2020
Сообщений: 46
По умолчанию

[QUOTE=Pavia;1810576]Илья37
Забыл сказать. Что для того что-бы поисковик начал индексировать Ваш сайт его надо добавить в поисковик иначе он не будет вас индексировать.
то есть просто выложить сайт на хостинг мало???

Последний раз редактировалось Илья37; 02.03.2020 в 16:39.
Илья37 вне форума Ответить с цитированием
Старый 02.03.2020, 16:42   #8
Илья37
Пользователь
 
Регистрация: 19.02.2020
Сообщений: 46
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Илья37
Забыл сказать. Что для того что-бы поисковик начал индексировать Ваш сайт его надо добавить в поисковик иначе он не будет вас индексировать.
то есть просто выложить сайт на хостинг мало?
Илья37 вне форума Ответить с цитированием
Старый 02.03.2020, 18:02   #9
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Desc
Цитата:
Сообщение от Desc Посмотреть сообщение
Выходит что современному гуглу на то что после тега meta глубоко бобарабану, и он индексирует все содержимое страницы?
Это надо спрашивать у тех кто профессионально занимается раскруткой сайтов. Но я предполагаю что так. На данный момент используется техники извлечения фактов, а они действуют по абзацам. Единичные слова и предложения им уже не интересны. Разве что поиск новых слов.


Илья37
Цитата:
Сообщение от Илья37 Посмотреть сообщение
то есть просто выложить сайт на хостинг мало?
Именно, мало. Если не добавить свой сайт то поисковики не будут заглядывать на Ваш сайт, а в лучшем случае найдёт единичные страницы. Как добавить можно прочитать здесь
https://support.google.com/webmaster...er/34397?hl=ru
https://yandex.ru/support/webmaster/robot-workings/

Некоторые хостеры предоставляют бесплатную услугу по добавления в поисковики.

Да и вообще нужно о себе заявить, про рекламировать себя и раскрутить.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 02.03.2020, 18:32   #10
Alar
Александр
Администратор
 
Аватар для Alar
 
Регистрация: 28.10.2006
Сообщений: 17,534
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Именно, мало
не мало, гуглхромом по сайту походите или фаерфоксом - всё и сольётся куда надо), давно это работало так, очень давно.

Также можно на любом ресурсе кинуть ссылку на ваш сайт, это чтобы типа наверняка и трастовость заодно прокачать выше нуля.

Цитата:
Некоторые хостеры предоставляют бесплатную услугу по добавления в поисковики.
какие-то услуги устаревшие из 90-х )
лучше из 00-х рассказать про прогон по каталогам сайтов )
Alar вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
с++,циклическая очередь, сразу норм выводит, а потом на где-то логика нарушается и неправильно выводит nati_94 Помощь студентам 2 17.03.2013 14:29
Поисковик Sk_R Microsoft Office Access 0 29.04.2011 17:20
поисковик в DLL LeDиNkо Помощь студентам 0 17.12.2009 23:48
поисковик C# Neymexa Общие вопросы .NET 8 29.03.2009 10:39
поисковик C# Neymexa Помощь студентам 2 27.03.2009 22:28