Cursos de Processamento de Linguagem Natural

Por que estudar Processamento de Linguagem Natural?

Antes de mais nada você precisa saber o que é "Linguagem Natural", na verdade linguagens naturais são aquelas que aprendemos desde criança (por exemplo, português, inglês, etc.) e usando esse tipo de linguagem podemos nos comunicar, transmitir conhecimento, sentimento.

A linguística é um campo muito amplo da ciência e já é estudada durante séculos. No entanto, com o advento da internet foi possível ter acesso a milhares de páginas de conteúdo em um só lugar. Além disso, os poder de processamento dos computadores permitiu que cientistas começassem a compreender melhor como tratar computacionalmente esse tipo de conteúdo.

O Processamento de Linguagem Natural (PLN) foi criado como uma subárea da ciência da computação e também da inteligência artificial. Com ele somos capazes de criar programas capazes de compreender textos, extrair informações, criar novos textos, classificar textos, entre outras milhares de tarefas.

Objetivos e
Público alvo

Desde a criação do PLN, várias aplicações muito interessantes foram criadas para auxiliar a vida das pessoas, por exemplo, os corretores de textos que você usa no seu processador de texto. No entanto, apesar dessa ciência ter evoluído bastante ao longo dos anos ainda é muito comum que essa ciência seja muito "inacessível" para as pessoas.

Nosso objetivo aqui no blog é disponibilizar conteúdo gratuito para mostrar os avanços dessa ciência. É um fato que alguns assuntos são bastante densos e específicos, porém, gostaríamos de tornar esses assuntos mais acessíveis. Portanto, buscamos em cada post adaptar o conteúdo para uma linguagem com o menor nível de termos científicos possíveis e mais simples aplicada ao mundo real. Dessa forma, é mais fácil compreender como o PLN pode impactar na vida cotidiana e resolver problemas de forma mais criativa.

Curso de PLN em Python

Por que devo escolher o Python?

Quase toda a comunidade envolvida área de inteligência artificial adotou o Python como linguagem principal para desenvolver seus projetos. Atualmente, existem centenas de bibliotecas para lidar com dados de forma muito eficiente e também que implementam técnicas consagradas da área.

Com o PLN não foi diferente, a comunidade se envolveu na criação do NLTK (Natural Language Toolkit) que pode ser usado em conjunto com outras ferramentas. Atualmente, com poucas linhas de código você consegue treinar um classificador, pré-processar textos, extrair informações e muito mais.

O Python é uma excelente opção devido ao grande suporte da comunidade, facilidade de compreensão da sintaxe e também a acessibilidade, visto que a maioria dos recursos são open source.

Instalação

A instalação do ambiente para começar a trabalhar com PLN é bastante simples. O pacote básico inclui apenas a instalação do Python e de um editor de texto. Atualmente, existem várias IDE's de programação para Python que são muito boas (por exemplo, o pycharm). No entanto, eu recomendo fortemente a instalação de um ambiente mais completo para desenvolvimento de aplicações de ciência de dados e PLN que é o Anaconda.

Conteúdo

Curso de PLN em Java

Por que devo escolher o Java?

São mais de 20 anos de dedicação da comunidade a essa linguagem tornando a linguagem Java uma das linguagens mais conhecidas e com toneladas de conteúdo na internet. Apesar da IA ter se tornado "modinha", PLN já existe e é estudado há muitos anos, sendo assim, antes da popularização do Python era muito comum construir os aplicativo usando Java.

Nesse contexto, aplicações incríveis como o Weka foi criado e até hoje é referência nesse campo. Além disso, podemos mencionar várias universidades desenvolvendo sistemas de PLN de altíssima qualidade e dando suporte a esses sistemas (por exemplo, a universidade de Stanford).

Instalação

Para instalar o ambiente e começar a criar seus projetos de PLN em Java é necessário seguir o passo a passo básico de instalação do ambiente. Você vai precisar do JDK (java development kit) e também de um editor de texto ou IDE de programação. Eu recomendo a utilização do Netbens, que é grátis e bastante fácil de usar.

Conteúdo