ПРОБЛЕМЫ И МЕТОДЫ ИЗВЛЕЧЕНИЯ ИЗ ТЕКСТОВ ИНФОРМАЦИИ О БИЗНЕС-СОБЫТИЯХ

В.Д. Соловьев

Казанский (Приволжский) федеральный университет

Описываются технология извлечения информации из текстов на естественном языке и нерешенные проблемы в этой области (Information Extraction). Излагаются основные решения, принятые в системе извлечения бизнес-событий, разрабатываемой КФУ по заказу фирмы Хьюлетт-Паккард. Отличительными особенностями системы являются обработка текстов на русском языке из новостных лент и ориентация на корпоративных клиентов, что предполагает обработку информации в режиме on-line и работу с огромными базами данных, такими как реестры компаний.

   
www.kai.ru