Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 01.11.2019, 14:20   #1
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,841
По умолчанию Алгоритм классификации текста

Здравствуйте.
Есть задача на классификацию текста.
Даны небольшие отрывки текста в которых описаны определенные действия людей. И есть справочник классов. Нужен какой то алгоритм который сможет проанализировать фрагмент текста и определить к какому классу он относится.
Что то типа определить тематику сообщения.

Пример текста такой:
Однажды в студеную зимнюю пору
Лошадка пипи***ой примерзла к забору.

класс 1: "Примерзание" - характеризуется примерзанием конечностей к различным объектам.

Вроде вычитал что существуют какие то методы но не смог найти ни одной реализации или примера рабочего.
Может кто подскажет чего нибудь полезного?
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 15:46   #2
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 16:03   #3
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,841
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Походу у вас словаря не хватает. Либо датасета с 1 000 примерами.
Проблема в том что сам датасет генерирует пользователь который особо не придерживается структуры. Натренировать нейросеть наверное врядли получится.
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 01.11.2019, 16:37   #4
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Лучше в телеге спросите
Natural Language Processing
https://t.me/natural_language_processing
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 01.11.2019, 17:06   #5
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Catboost советуют попробовать
https://youtu.be/xl1fwCza9C8
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Нейронная сеть для классификации текста antoshkatrue Python 0 15.04.2017 16:35
Нейронная сеть для классификации текста antoshkatrue Фриланс 1 10.04.2017 10:19
Какой метод коллективного распознавания использовать для классификации цифр/символов? ChicoID Общие вопросы по программированию, компьютерный форум 1 08.10.2016 13:01
Пропадает часть текста. Алгоритм преобразования текста. SashaRasha Общие вопросы Delphi 6 03.03.2014 06:25
Описание классификации информации Kseniya S Помощь студентам 0 18.06.2012 17:27