Text Mining
Según un estudio de Forrester Research, aproximadamente el 80% de las informaciones de business de una empresa está “enredado” en documentos de texto no estructurado (e-mail, informes internos, etc…). En otras palabras y según el estado actual de las cosas, la mayoría de las informaciones potencialmente útiles para una empresa son desconocidas en gran medida por la misma empresa fuera del proceso productivo. Evidentemente este es un problema muy similar al de que, para los datos estructurados, responden los más consolidados procesos de Data Mining. Esta simple consideración indica cuánto pueden ser útiles procesos de extracción de nuevos conocimientos de textos mediante técnicas de Text Mining.
El pasaje de datos textuales, no estructurados, a datos estructurados, medibles, no es indoloro, y la utilidad misma de los sistemas de Descubrimiento de Conocimiento en Textos está fuertemente condicionada por la cantidad y por la calidad que el conocimiento de la tecnología a disposición son capaces de extraer del texto. La dificultad de este cometido ha representado tradicionalmente un obstáculo no banal para la realización de sistemas de Text Mining. No obstante, en un pasado reciente, el desarrollo de tecnologías de Procesamiento del Lenguaje Natural y Descubridor de Conocimiento en Database, así como instrumentos software especializados, han hecho posible la consecución de dicho ambicioso objetivo.
De hecho, la tecnología disponible actualmente ha permitido la implementación de soluciones a problemas empresariales reales. Soluciones que se han revelado un caso de estudio de éxito.