ПРОБЛЕМЫ И МЕТОДЫ ИЗВЛЕЧЕНИЯ ИЗ ТЕКСТОВ ИНФОРМАЦИИ О БИЗНЕС-СОБЫТИЯХ
В.Д. Соловьев
Казанский (Приволжский) федеральный университет
Описываются технология извлечения информации из текстов на естественном
языке и нерешенные проблемы в этой области (Information Extraction).
Излагаются основные решения, принятые в системе извлечения бизнес-событий,
разрабатываемой КФУ по заказу фирмы Хьюлетт-Паккард. Отличительными
особенностями системы являются обработка текстов на русском языке из
новостных лент и ориентация на корпоративных клиентов, что предполагает
обработку информации в режиме on-line и работу с огромными базами данных,
такими как реестры компаний.
|