Форум программистов
 
О проблемах, например, с регистрацией пишите сюда - alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите активизацию e-mail, а тут можно восстановить пароль.

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail


Ответ
 
Опции темы
Старый 01.11.2019, 14:20   #1
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,557
По умолчанию Алгоритм классификации текста

Здравствуйте.
Есть задача на классификацию текста.
Даны небольшие отрывки текста в которых описаны определенные действия людей. И есть справочник классов. Нужен какой то алгоритм который сможет проанализировать фрагмент текста и определить к какому классу он относится.
Что то типа определить тематику сообщения.

Пример текста такой:
Однажды в студеную зимнюю пору
Лошадка пипи***ой примерзла к забору.

класс 1: "Примерзание" - характеризуется примерзанием конечностей к различным объектам.

Вроде вычитал что существуют какие то методы но не смог найти ни одной реализации или примера рабочего.
Может кто подскажет чего нибудь полезного?
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 15:46   #2
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,162
По умолчанию

Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 16:03   #3
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,557
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Проблема в том что сам датасет генерирует пользователь который особо не придерживается структуры. Натренировать нейросеть наверное врядли получится.
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 16:37   #4
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,162
По умолчанию

Лучше в телеге спросите
Natural Language Processing
https://t.me/natural_language_processing
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 17:06   #5
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,162
По умолчанию

Catboost советуют попробовать
https://youtu.be/xl1fwCza9C8
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Ответ

Здесь нужно купить рекламу за 20 тыс руб в месяц! ) пишите сюда - alarforum@yandex.ru
Без учёта ботов - 20000 человек в день, 350000 в месяц.

Опции темы


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Нейронная сеть для классификации текста antoshkatrue Python 0 15.04.2017 16:35
Нейронная сеть для классификации текста antoshkatrue Фриланс 1 10.04.2017 10:19
Какой метод коллективного распознавания использовать для классификации цифр/символов? ChicoID Общие вопросы по программированию, компьютерный форум 1 08.10.2016 13:01
Пропадает часть текста. Алгоритм преобразования текста. SashaRasha Общие вопросы Delphi 6 03.03.2014 05:25
Описание классификации информации Kseniya S Помощь студентам 0 18.06.2012 16:27


Проекты отопления, пеллетные котлы, бойлеры, радиаторы
интернет магазин respective.ru
Пеллетный котёл Emtas
котлы EMTAS
Здесь нужно купить рекламу за 7 тыс руб в месяц! )
пишите сюда - alarforum@yandex.ru
ИКС 840