Fenômenos econômico-tecnológicos como o Big Data revolucionam essencialmente os paradigmas das relações produtivas, onde, a geração de dado útil em tempo hábil passa a definir a sobrevivência das organizações. Para se usufruir economicamente desta massa de dados, exige-se capacidade inusitada de mineração de dados e reconhecimento de informação útil escondidas neste universo gigantesco de dados eletrônicos desordenados. Neste sentido, este projeto buscou desenvolver camadas de softwares primordiais de IA/PLN capazes de identificar, qualificar e quantificar palavras em meio a grandes volumes de dados textuais não-estruturados de corpus textuais em língua portuguesa de laudos de imagem e de descrição clínica em segmentos prioritárias como a pneumologia, oncologia estrutura da próstata, estrutura mamária (Bi-Rads) e cardiovascular/hipertensão.