Форум программистов
 
Контакты: о проблемах с регистрацией, почтой и по другим вопросам пишите сюда - alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите активизацию e-mail.

Вернуться   Форум программистов > Технологии > Общие вопросы по программированию, компьютерным наукам
Регистрация

Восстановить пароль
Повторная активизация e-mail

Здесь нужно купить рекламу за 20 тыс руб в месяц! ) пишите сюда - alarforum@yandex.ru
Без учёта ботов - 20000 человек в день, 350000 в месяц.

Ответ
 
Опции темы
Старый 01.11.2019, 15:20   #1
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,463
По умолчанию Алгоритм классификации текста

Здравствуйте.
Есть задача на классификацию текста.
Даны небольшие отрывки текста в которых описаны определенные действия людей. И есть справочник классов. Нужен какой то алгоритм который сможет проанализировать фрагмент текста и определить к какому классу он относится.
Что то типа определить тематику сообщения.

Пример текста такой:
Однажды в студеную зимнюю пору
Лошадка пипи***ой примерзла к забору.

класс 1: "Примерзание" - характеризуется примерзанием конечностей к различным объектам.

Вроде вычитал что существуют какие то методы но не смог найти ни одной реализации или примера рабочего.
Может кто подскажет чего нибудь полезного?
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 16:46   #2
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,007
По умолчанию

Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 17:03   #3
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,463
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Проблема в том что сам датасет генерирует пользователь который особо не придерживается структуры. Натренировать нейросеть наверное врядли получится.
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 17:37   #4
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,007
По умолчанию

Лучше в телеге спросите
Natural Language Processing
https://t.me/natural_language_processing
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 18:06   #5
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,007
По умолчанию

Catboost советуют попробовать
https://youtu.be/xl1fwCza9C8
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Ответ
Опции темы


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Нейронная сеть для классификации текста antoshkatrue Python 0 15.04.2017 17:35
Нейронная сеть для классификации текста antoshkatrue Фриланс 1 10.04.2017 11:19
Какой метод коллективного распознавания использовать для классификации цифр/символов? ChicoID Общие вопросы по программированию, компьютерным наукам 1 08.10.2016 14:01
Пропадает часть текста. Алгоритм преобразования текста. SashaRasha Общие вопросы Delphi 6 03.03.2014 06:25
Описание классификации информации Kseniya S Помощь студентам 0 18.06.2012 17:27