07.12.2004 18:28
Новости.
Просмотров всего: 9030; сегодня: 1.

Fact Extractor - новое слово в аналитической обработке текста на русском языке

Компания Гарант-Парк-Интернет объявляет о выходе первой версии программы RCO Fact Extractor - персонального приложения для Windows, которое предназначено для аналитической обработки текста на русском языке.

Основная сфера применения программы – это задачи из области компьютерной разведки, требующие высокоточного поиска информации, например, автоматический подбор материала к досье на целевой объект или же мониторинг определенных сторон его активности, освещаемых в СМИ.

Fact Extractor способен отыскать в тексте описания фактов различного типа, связанных с интересующими объектами - персонами и организациями, и классифицировать их. Программа позволяет не только найти фрагменты текста, в которых говорилось, например, о поездках персоны, ее встречах, заключении договоров, сделках купли-продажи, но и точно определить все места поездок, визави и контрагентов, наименования товаров и прочее.

Программа работает в среде Windows 2000 и выше и позволяет обрабатывать документы в популярных текстовых форматах из различных источников - файловой системы, заданных web-сайтов, базы данных.

Результат работы программы – таблица, которая содержит информацию о найденных фактах, связанных с объектами мониторинга, и может экспортироваться в html-формат для формирования отчета или для загрузки в стороннее приложение, работающее с уже структурированными данными.

Fact Extractor – это интеллектуальная программа для высокоточного избирательного анализа информации, поэтому она предполагает настройку шаблонов для поиска и классификации фактов самых различных типов. Такие специализированные шаблоны либо приобретаются отдельно, либо создаются пользователем самостоятельно при помощи дополнительной программы Fact Tuner. Тем не менее, даже стандартные шаблоны, включенные в комплект поставки Fact Extractor, позволяют распознавать огромное количество самых разнообразных фактов, но без детальной классификации, т.е., попросту находить события, в которых участвует целевой объект, и извлекать из текста всех прочих фигурантов этих событий, без детализации их ролей. С учетом уникальных механизмов выделения и отождествления различных обозначений объектов в тексте, даже эти стандартные возможности делают Fact Extractor незаменимым поисковым инструментом в тех случаях, когда поиск ведется по персонам и организациям.

Выпуск нового продукта прокомментировал руководитель направления RCO компании “Гарант-Парк-Интернет” Владимир Плешко:

“Наша компания уже около четырех лет занимается разработкой специализированного программного обеспечения в области компьютерной лингвистики. За это время лингво-аналитические компоненты были успешно введены в эксплуатацию в корпоративных системах ряда силовых ведомств и коммерческих структур. Почему мы решили создать персональную систему? Дело в том, что несмотря на интенсивное развитие ИТ-индустрии в России, подавляющее большинство аналитических, маркетинговых отделов и служб безопасности компаний осуществляют обработку текстовой информации, связанной с интересующими объектами, практически вручную. Они вводят запрос с элементами ФИО персоны или наименованием организации в поисковую машину, а затем разгребают вываленную “кучу мусора”, поскольку поисковик не способен точно распознать большинство фамилий и наименований, не говоря уже об отборе и структурировании связанной с ними информации. Нам бы хотелось заполнить такую брешь в сфере поисковых систем, для чего мы выводим на рынок принципиально новую систему, основанную не на документальном, а на фактографическом поиске.

Очень много реализовано нами в ядре программы, начиная от алгоритмов выделения наименований организаций и персон, отождествления их полных, кратких и косвенных наименований, местоимений, до механизмов синтаксического разбора и поиска изоморфизмов в семантических сетях. Тем не менее, пользовательский интерфейс программы выглядит достаточно просто – отчет в виде таблицы найденных фактов. Экспорт результатов также весьма примитивен. Но удобство, как говорится, дело наживное. Программа же выполняет главное – превращает “сырой” текст в структурированные и типизированные данные – разложенные по полочкам факты для таблиц БД. И на сегодняшний день сделать этого не способна ни одна другая программа!

Конечно же, мы планируем развивать функционал по просмотру, фильтрации и экспорту полученных фактов. Мы, безусловно, планируем интеграцию нашего продукта с системами обработки знаний других производителей, что позволило бы полноценно использовать математические методы для анализа найденных нами фактов в совокупности. Но, в первую очередь, при развитии продукта мы будем опираться на отзывы, пожелания и нарекания со стороны наших новых пользователей, появления которых мы ожидаем в ближайшее время”.


Ньюсмейкер: Гарант-Парк — 11 публикаций
Поделиться:

Интересно:

Лейб-гвардии Семеновский полк: первые в боях и походах
23.05.2025 18:23 Аналитика
Лейб-гвардии Семеновский полк: первые в боях и походах
В дореволюционной России этот полк отмечал день своего создания 23 мая каждого года. Семеновский полк — один из двух первых полков русской гвардии. Он по праву считался одним из лучших в рядах Императорской гвардии. Созданный самим Петром Великим, полк снискал неувядаемую славу и всеобщее уважение. О славных семеновцах и пойдет сегодня речь. Название полку дало подмосковное село Семеновское недалеко от одного из мест летнего пребывания царского двора. Изначально Семёновский полк относился к так называемым потешным полкам. Их создали для игр и забав молодого царя Петра Алексеевича и его ближайшего окружения из дворянских недорослей и дворовых слуг. Вскоре забава с «потешным войском» обрела иной смысл: создать профессионально подготовленную и преданную монарху гвардию, которая могла бы защитить Петра от любого...
Об антифашистских движениях в странах Европы расскажет выставка
23.05.2025 15:26 Мероприятия
Об антифашистских движениях в странах Европы расскажет выставка
В Библиотеке иностранной литературы состоялась торжественная церемония открытия мультимедийной выставки «Сопротивление Европы», посвященной архивным документам об антифашистских движениях в странах Европы. Вечер начался с приветственного слова Министра культуры Российской Федерации Ольги Любимовой, которое представила генеральный директор Библиотеки иностранной литературы Марина Захаренко. Ольга Любимова, Министр культуры Российской Федерации: "Выставка Всероссийской государственной библиотеки иностранной литературы им. М. И. Рудомино, организованная совместно с Российским государственным военным архивом и семьей Маргариты Ивановны Рудомино, подтверждает тот факт, что в России помнят о героях Сопротивления и чтут память о них. Движение Сопротивления в странах Европы носило интернациональный...
Москва приняла участие в форуме «Россия – Исламский мир: KazanForum»
22.05.2025 16:39 Новости
Москва приняла участие в форуме «Россия – Исламский мир: KazanForum»
Департамент внешнеэкономических и международных связей города Москвы (ДВМС) принял активное участие в XVI Международном экономическом форуме «Россия – Исламский мир: KazanForum». Делегацию возглавил Министр Правительства Москвы, руководитель Департамента внешнеэкономических и международных связей Сергей Черёмин. Министр выступил на нескольких ключевых мероприятиях. В частности, на сессии «Россия – страны MENA: от торговли к кооперационным проектам» он рассказал о торгово-экономическом и инвестиционном сотрудничестве Москвы со странами региона MENA. В 2024 году товарооборот Москвы с государствами Ближнего Востока и Северной Африки составил около 14,4 млрд долларов. Этот показатель не только растёт, но и становится более диверсифицированным. Помимо традиционных поставок сырьевых товаров, увеличивается экспорт высокотехнологичной продукции — машин и оборудования, электротехнических...
1000 лет со дня рождения Анны Ярославны
22.05.2025 16:13 Аналитика
1000 лет со дня рождения Анны Ярославны
В Средние века дипломатических контактов между Францией и Русью практически не существовало. Исключением стал династический брак между королем Генрихом І и княжной Анной Ярославной, дочерью великого князя киевского Ярослава Владимировича Мудрого. Ярослав Мудрый запомнился не только масштабными преобразованиями и внешнеполитическими успехами, но и обширными династическими связями: его женой была дочь шведского короля Олафа, он выдал замуж свою сестру за польского короля, а двух старших дочерей – за венгерского и норвежского королей. В России длительное время было неизвестно об этой интересной матримониальной связи, так как в фокус внимания летописцев не попадали подобные события. До сих пор мы не знаем о происхождении и судьбе многих жен и дочерей древнерусских князей. Даты рождения Анны Ярославны и ее кончины точно не установлены. В историографии сложилось мнение, что она родилась не...
Как реставрировали знамя, пожалованное Екатериной II Войску Донскому
22.05.2025 10:12 Аналитика
Как реставрировали знамя, пожалованное Екатериной II Войску Донскому
В 2022 году во Всероссийский художественный научно-реставрационный центр имени академика И.Э. Грабаря на реставрацию поступило уникальное знамя из Музея истории донского казачества. Это знамя в 1775 году было пожаловано Екатериной II Войску Донскому за отвагу и доблесть, проявленные в войне с турками. Художник-реставратор высшей категории Галина Безрукова-Евсеенко рассказала об истории знамени и его особенностях, а также о процессе реставрации. Уникальный внешний вид Это знамя – единственное в своем роде и не имеет аналогов. Екатерина II решила поощрить и отметить казаков за верную службу и доблесть в предшествовавших войнах – пожаловала им знамя, совершенно отличное от всех существовавших прежде, которые были довольно большие по размеру с изображениями, написанными красками. Новое знамя из белого штофа было значительно меньше в размерах и почти квадратное: стороны – около 115 см с...