Análise sintáctica multilingüe de textos


Produtos de software que integren algún tipo de procesamento intelixente da información textual. A base de tales procesos estará constituída pola información sintáctica obtida das oracións do devandito texto.

Estado de protección da tecnoloxía

Tres rexistros de software:

  • Compiler for parsing schemata (COMPAS), solicitude C-40-09, asento rexistral 03/2009/445. Titulares: Universidade da Coruña (Carlos Gómez Rodríguez e Miguel A. Alonso Pardo).
  • Transition-based dependency parser with buffered transitions, solicitude OU-18-2014, asento rexistral 03/2014/437. Titulares: Universidade de Vigo (Daniel Fernández González) e Universidade da Coruña (Carlos Gómez Rodríguez).
  • Transition-based dependency parser with dependency graphs, solicitude OU-19-2014, asento rexistral 03/2014/442. Titulares: Universidade de Vigo (Daniel Fernández González) e Universidade da Coruña (Carlos Gómez Rodríguez).

Que buscamos?

Búscanse empresas interesadas na licenza desta tecnoloxía.

Facultade de Filoloxía. CITIC

Descrición

A popularización das tecnoloxías da información e Internet deu lugar a un crecemento sen precedentes na escala en que individuos e institucións xeran información, a comunican e acceden a ela. Porén, precisamente debido a tan vasta dispoñibilidade, o aproveitamento efectivo de datos e información constitúe un dos problemas fundamentais das sociedades modernas.

Dado que a forma da maior parte desta información corresponde á linguaxe humana escrita, as tecnoloxías de procesamento da linguaxe natural son un activo chave para atinxir o devandito obxectivo. No seu seo, unha tarefa fundamental constitúea a realización dunha análise sintáctica precisa para así poder extraer e analizar o significado das oracións.

Neste contexto, o grupo LYS desenvolveu ferramentas de análise precisas e veloces, capaces de obter a devandita información sintáctica operando tanto no marco das dependencias sintácticas, máis flexibles, como no dos máis diversos formalismos gramaticais baseados en constituíntes.

Valores engadidos

No marco da análise de constituíntes, fornecemos un compilador capaz de xerar de maneira automática analizadores sintácticos eficientes a partir dos chamados esquemas de análise sintáctica. Tales esquemas son representacións abstractas e intuitivas, en forma de sistemas dedutivos, dos algoritmos de análise para implementar. O seu uso permítenos abstraernos dos detalles de implementación, así como definir e comparar facilmente diferentes algoritmos entre si.

O noso sistema permite xerar automaticamente, a partir dun destes esquemas, o código correspondente a unha implementación eficiente do algoritmo. O sistema acepta todo tipo de esquemas de analizadores para gramáticas independentes do contexto e gramáticas de adxunción de árbores, e pode estenderse de xeito fácil a outros formalismos gramaticais.

Así mesmo, no marco da análise sintáctica tanto de dependencias como de constituíntes, o grupo LYS está en condicións de proporcionar analizadores sintácticos adestrables para calquera idioma, os cales ben están á par daqueles que constitúen o estado da arte, ben os superan, e que, pola súa superior velocidade, poden ser usados con grandes volumes de datos.

Aplicacións por sector

Os sistemas e as técnicas de análise sintáctica son chave en toda aplicación dedicada ao procesamento e á análise automática de textos de linguaxe natural. O seu abano de aplicacións é moi diverso: vai desde romper as barreiras do idioma (tradución automática) e encontrar a información requirida (motores de busca, resposta automática a preguntas) a analizar a opinión pública (extracción de opinións), pasando por dixerir grandes cantidades de texto non estruturado en formas máis convenientes (extracción de información, resumo automático) ou incluso servir como soporte a chatbots e asistentes virtuais, entre outras aplicacións.


TIC

Grupo de investigación

    • Lengua e Sociedade da Información
    • (LYS)

Responsable

  • Carlos Gómez Rodríguez
  • Miguel Ángel Alonso Pardo
  • Mark David Anderson
  • Daniel Fernández González
  • Michalina Maria Strzyz
  • David Vilares Calvo

Contacta con nós

Última actualización

2019-07-16