-
Томита-парсер доступен вне Яндекса для всех желающих
17 декабря 2012 года | Яндекс
-
Напоминаем, с 15 декабря 2012 года Томита-парсер, инструмент для извлечения структурированных данных (фактов) из текста на естественном языке, стал доступен вне Яндекса для всех желающих. Теперь его можно скачать, написать свои грамматики и запускать в своих проектах.
Примеры фактов, которые можно извлекать:
• дата рождения человека (Ричард Гир родился 31 августа 1949 года);
• родственные связи (Ричард Гир женат на Кэри Лоуэлл);
• исполнение ролей в фильмах (Ричард Гир — звезда фильма «Красотка»);
• адреса организаций (Офис Яндекса находится на улице Льва Толстого дом 16), и другие.
Томита-парсер используется в подготовке данных для различных сервисов Яндекса, таких как Яндекс.Новости или Яндекс.Работа.
Как мы уже сообщали, Томита-парсер был впервые показан на семинаре Яндекса по «Автоматической обработке естественного языка», который состоялся 15 декабря 2012 года в Санкт-Петербурге. Все участники семинара смогли написать свою первую грамматику, запустить ее на текстах и извлечь свои первые факты. Провели мастер-класс сотрудники лингвистического отдела Яндекса Наталья Остапук, Дмитрий Панкратов и Виктор Бочаров.
Последние комментарии
mogzem: Полезная информация для родителей - на что обратит »
Вадим: Спасибо за новость »
Анастасия: Очень люблю такую маску! Кстати, мёд тоже :) Ещё я »
onlinemixx: А спецы америкосов стопроцентов уже давно имеют до »