07.12.2004 18:28
Новости.
Просмотров всего: 9240; сегодня: 3.

Fact Extractor - новое слово в аналитической обработке текста на русском языке

Компания Гарант-Парк-Интернет объявляет о выходе первой версии программы RCO Fact Extractor - персонального приложения для Windows, которое предназначено для аналитической обработки текста на русском языке.

Основная сфера применения программы – это задачи из области компьютерной разведки, требующие высокоточного поиска информации, например, автоматический подбор материала к досье на целевой объект или же мониторинг определенных сторон его активности, освещаемых в СМИ.

Fact Extractor способен отыскать в тексте описания фактов различного типа, связанных с интересующими объектами - персонами и организациями, и классифицировать их. Программа позволяет не только найти фрагменты текста, в которых говорилось, например, о поездках персоны, ее встречах, заключении договоров, сделках купли-продажи, но и точно определить все места поездок, визави и контрагентов, наименования товаров и прочее.

Программа работает в среде Windows 2000 и выше и позволяет обрабатывать документы в популярных текстовых форматах из различных источников - файловой системы, заданных web-сайтов, базы данных.

Результат работы программы – таблица, которая содержит информацию о найденных фактах, связанных с объектами мониторинга, и может экспортироваться в html-формат для формирования отчета или для загрузки в стороннее приложение, работающее с уже структурированными данными.

Fact Extractor – это интеллектуальная программа для высокоточного избирательного анализа информации, поэтому она предполагает настройку шаблонов для поиска и классификации фактов самых различных типов. Такие специализированные шаблоны либо приобретаются отдельно, либо создаются пользователем самостоятельно при помощи дополнительной программы Fact Tuner. Тем не менее, даже стандартные шаблоны, включенные в комплект поставки Fact Extractor, позволяют распознавать огромное количество самых разнообразных фактов, но без детальной классификации, т.е., попросту находить события, в которых участвует целевой объект, и извлекать из текста всех прочих фигурантов этих событий, без детализации их ролей. С учетом уникальных механизмов выделения и отождествления различных обозначений объектов в тексте, даже эти стандартные возможности делают Fact Extractor незаменимым поисковым инструментом в тех случаях, когда поиск ведется по персонам и организациям.

Выпуск нового продукта прокомментировал руководитель направления RCO компании “Гарант-Парк-Интернет” Владимир Плешко:

“Наша компания уже около четырех лет занимается разработкой специализированного программного обеспечения в области компьютерной лингвистики. За это время лингво-аналитические компоненты были успешно введены в эксплуатацию в корпоративных системах ряда силовых ведомств и коммерческих структур. Почему мы решили создать персональную систему? Дело в том, что несмотря на интенсивное развитие ИТ-индустрии в России, подавляющее большинство аналитических, маркетинговых отделов и служб безопасности компаний осуществляют обработку текстовой информации, связанной с интересующими объектами, практически вручную. Они вводят запрос с элементами ФИО персоны или наименованием организации в поисковую машину, а затем разгребают вываленную “кучу мусора”, поскольку поисковик не способен точно распознать большинство фамилий и наименований, не говоря уже об отборе и структурировании связанной с ними информации. Нам бы хотелось заполнить такую брешь в сфере поисковых систем, для чего мы выводим на рынок принципиально новую систему, основанную не на документальном, а на фактографическом поиске.

Очень много реализовано нами в ядре программы, начиная от алгоритмов выделения наименований организаций и персон, отождествления их полных, кратких и косвенных наименований, местоимений, до механизмов синтаксического разбора и поиска изоморфизмов в семантических сетях. Тем не менее, пользовательский интерфейс программы выглядит достаточно просто – отчет в виде таблицы найденных фактов. Экспорт результатов также весьма примитивен. Но удобство, как говорится, дело наживное. Программа же выполняет главное – превращает “сырой” текст в структурированные и типизированные данные – разложенные по полочкам факты для таблиц БД. И на сегодняшний день сделать этого не способна ни одна другая программа!

Конечно же, мы планируем развивать функционал по просмотру, фильтрации и экспорту полученных фактов. Мы, безусловно, планируем интеграцию нашего продукта с системами обработки знаний других производителей, что позволило бы полноценно использовать математические методы для анализа найденных нами фактов в совокупности. Но, в первую очередь, при развитии продукта мы будем опираться на отзывы, пожелания и нарекания со стороны наших новых пользователей, появления которых мы ожидаем в ближайшее время”.


Ньюсмейкер: Гарант-Парк — 11 публикаций
Поделиться:

Интересно:

Копилка русского классика. На что жили русские писатели XIX века
12.02.2026 13:27 Аналитика
Копилка русского классика. На что жили русские писатели XIX века
На что жили и как тратили свои гонорары великие писатели XIX века. Александр Сергеевич Пушкин: чиновник, помещик и азартный игрок Первые годы творчества А.С. Пушкина не были для поэта «хлебными»: в те времена основной его доход составляли не гонорары, а обычное чиновничье жалование – 700 рублей в год ассигнациями. Первый серьезный заработок за литераторство был получен им после написания «Руслана и Людмилы». Поэт получил полторы тысячи рублей и популярность «в придачу». До той поры, когда в светском обществе двух столиц звучала фамилия «Пушкин», имели в виду дядю Александра Сергеевича – Василия Львовича. С тех пор Пушкин постоянно требовал увеличения гонораров, и, нужно признать, небезосновательно. За «Повести Ивана Петровича Белкина» – пять тысяч рублей, а за «Евгения Онегина» – все двенадцать. Правда, столь крупный гонорар дался поэту тяжело: будучи азартным игроком в карты, однажды...
Ледник на колесиках. Как холодильник совершил бытовую революцию
10.02.2026 13:43 Аналитика
Ледник на колесиках. Как холодильник совершил бытовую революцию
В повседневной жизни мы часто пользуемся вещами, об истории создания которых даже не задумываемся. На рынке техники из года в год появляются все более продвинутые девайсы, способные выполнить большую часть домашних дел за человека. Многие из них стали настолько привычными, что без них мы уже не представляем собственного быта. Например, холодильник. Некогда наши предки создавали для хранения пищи специальные погреба с кубами льда вперемежку с соломой, а современному человеку достаточно лишь подключить «ледник» к электросети, открыть дверцу и поместить на полку любой продукт. От Сибири до Балтики   Необходимость заготавливать пищу впрок появилась за много столетий до того, как был запатентован первый холодильник. Неспроста все народы, ведущие оседлый образ жизни, освоили консервирование, копчение и маринование. В России холодильное дело начинает развиваться в XIX столетии. Правда...
Miji Group создала новый “визуальный язык” проекта «Брусники» в Москве
08.02.2026 20:24 Новости
Miji Group создала новый “визуальный язык” проекта «Брусники» в Москве
Девелопер «Брусника» реализует в Москве свой первый премиальный проект — жилой комплекс «Дом А», расположенный в Даниловском районе. Выход в столицу стал для компании важным стратегическим шагом, поэтому особое внимание было уделено позиционированию проекта и его визуальной упаковке. К работе по переработке уже существующего 3D-визуала была привлечена международная компания Miji Group. Перед командой стояла срочная задача: проект находится в активной стадии реализации, а обновленный визуальный контент был необходим в сжатые сроки. Команда Miji Visual совместно с Miji Land и Miji Interior подошла к работе комплексно: не просто обновив рендеры, а заново сформировав визуальный язык объекта. В рамках проекта были созданы ключевые имиджевые изображения, включая флагманский рендер, который стал центральным элементом новой визуальной концепции «Дома А». Команда детально проанализировала...
06.02.2026 22:19 Консультации
ГИГАНТ: продление жизни зарубежных серверов стало тупиковой стратегией
О том, почему ремонт и поддержка импортных серверов больше не дают реальной экономии, какие риски накапливаются в инфраструктуре и почему все больше компаний осознанно переходят на отечественные серверные платформы, рассказывает Дмитрий Пустовалов, директор департамента обеспечения и развития компании «ГИГАНТ — Компьютерные системы». Насколько ремонт и продление срока службы зарубежного серверного оборудования сегодня экономически оправданы по сравнению с обновлением инфраструктуры?  С точки зрения долгосрочной экономики и управляемости ИТ-инфраструктуры - не оправданы. Переход на российские серверные решения сегодня является самым рациональным и правильным сценарием для большинства заказчиков. Ремонт и продление срока службы зарубежного оборудования, установленного до 2022 года, создают лишь иллюзию экономии. На практике компании фиксируют себя в зоне повышенных технологических и...
06.02.2026 22:17 Интервью, мнения
UDV Group: рекомендации по внедрению системы кибербезопасности
Эксперты UDV Group поделились в статье практическими рекомендациями по построению эффективной промышленной кибербезопасности — от архитектуры внедрения и управления рисками до интеграции ИТ- и OT-систем и оценки реальной эффективности защитных решений. Количество кибератак на промышленные предприятия продолжает расти, и под угрозой оказываются уже не только информационные ресурсы, но и технологические процессы. Остановки производственных линий, подмена кода программируемых логических контроллеров (ПЛК), вмешательство в системы управления объектами критической инфраструктуры предприятий — это давно не гипотетические сценарии, а кейсы, с которыми сталкиваются предприятия реального сектора экономики. Компании осознают необходимость выстраивания информационной защиты, но при переходе к реализации стратегии кибербезопасности сталкиваются с системными трудностями: необходимостью выбора из...