![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
![]()
Ребята,помогите,пожалуйста,набросат ь программку для извлечения фактов из текста. Например, "Андрей Васильев,директор торговой сети Евроопт заключил сделку с крупными поставщиками из России". Из этого должно быть извлечено:
Имя: Андрей Васильев Должность: Директор Организация:Евроопт |
![]() |
![]() |
![]() |
#2 |
Новичок
Джуниор
Регистрация: 11.10.2011
Сообщений: 3,882
|
![]()
Какой язык?
Я правильно понимаю, что : Всё что идет до запятой - это подходит под нашу графу "имя". Дальше (после запятой) - "должность" А то что с Большой буквы - организация.. ? |
![]() |
![]() |
![]() |
#3 |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
![]()
нифига себе "помогите"! Этак полноценную коммерческую софтину можно в качестве лабораторной сделать.
Ну для начала положим, что фактами могут служить: 1) существительные; 2) Имена собственные (и фамилии); Это автоматически отсечет из предложения все, что не является фактом. Следующий шаг: выделить имя (для этого используем словарь имен, словарь фамилий), выделить должность (словарь должностей), выделить наименование фирмы (два варианта - либо словарь наименований фирм использовать, либо относить к фирме все имена собственные, отсутствующие в первом словаре). Словарь наименований фирм имхо невыгоден просто потому, что у нас в стране этих фирм - как навоза за баней, и каждый в названии извращается как может. Со вторым способом тоже есть проблема - предположим, фирма называется "Валентина" в честь любимой тещи - в первом словаре она есть. Поэтому имеет смысл проверки сочетания "Имя-Фамилия" - если у имени есть фамилия, то это человек, если нет - то фирма. Как-то так. Размышления чисто от фонаря.
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
![]() |
![]() |
![]() |
#4 | ||
Санитар
Старожил
Регистрация: 04.10.2008
Сообщений: 2,577
|
![]()
ну да, такая штука стоит бесконечно много и вобще, почти нереальна если нет никаких ограничений на предложения.
Цитата:
Цитата:
|
||
![]() |
![]() |
![]() |
#5 | |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
![]() Цитата:
"Россия. Петров украл коров и был таков" Россия Петров - это человек ![]()
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
|
![]() |
![]() |
![]() |
#6 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
![]()
мне нужна элементарная программка,чтобы хотя бы одно это предложение разобрала и всё
|
![]() |
![]() |
![]() |
#7 | |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
![]() Цитата:
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
|
![]() |
![]() |
![]() |
#8 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
![]() |
![]() |
![]() |
![]() |
#9 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
![]() Цитата:
I'm learning to live...
|
|
![]() |
![]() |
![]() |
#10 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
![]()
где я могу взять словари и как их подключать?
|
![]() |
![]() |
![]() |
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
извлечение информации из текста | Alejandr0 | Microsoft Office Word | 2 | 06.09.2010 14:23 |
RichViewEdit, извлечение текста | Alter | Компоненты Delphi | 3 | 02.05.2010 14:02 |
извлечение текста | Kavaler2i | Общие вопросы Delphi | 1 | 27.01.2010 17:18 |
извлечение текста и стилевой разметки из doc на с++ | valid | Общие вопросы C/C++ | 0 | 06.04.2009 01:32 |