Artigos

Uma inteligência artificial pode ter senso comum?

O maior problema que a inteligência artificial enfrenta hoje é como ensinar os computadores o suficiente sobre o mundo cotidiano para que possam raciocinar sobre isso como fazemos – para que possam desenvolver o “senso comum”. Muitos acreditam que esse problema pode ser resolvido aproveitando o conhecimento das pessoas na Internet e construímos um site para tornar mais fácil e divertido para as pessoas trabalharem juntas para fornecer aos computadores os milhões de pequenos conhecimentos comuns que constituem o “senso comum”.

Se você gosta desse tipo de conteúdo, não esqueça de acessar nossos artigos gratuitos sobre PLN.

Ensinar os computadores a descrever e raciocinar sobre o mundo nos dará exatamente a tecnologia de que precisamos para levar a Internet a um novo patamar, de um gigantesco repositório de páginas da Web a um novo estado em que possa pensar sobre todo o conhecimento que contém; em essência, para torná-lo uma entidade viva.  

Buscando tornar esse sonho em realidade a OCMS (open mind common sense database), desde a sua fundação em 1999, acumulou mais de um milhão de dados em inglês de mais de 15.000 colaboradores, além de bases de conhecimento em outros idiomas. Grande parte do software da OMCS é construído sobre três representações interconectadas: o corpus de linguagem natural com o qual as pessoas interagem diretamente, uma rede semântica construída a partir deste corpus chamado ConceptNet e uma representação baseada em matriz do ConceptNet chamada AnalogySpace que pode inferir novos conhecimentos usando redução de dimensionalidade. O conhecimento coletado pelo Open Mind Common Sense permitiu projetos de pesquisa no MIT e em outros lugares.  

Um pouco da história

Esse projeto de trazer o senso comum para as máquinas foi idealizado por Marvin Minsky, Push Singh, Catherine Havasi e outros. O trabalho de desenvolvimento começou em setembro de 1999 e o projeto foi aberto à Internet um ano depois.

Havasi descreveu-a em sua dissertação como “uma tentativa de aproveitar um pouco do poder de computação humana distribuído da Internet, uma ideia que estava apenas em seus estágios iniciais”. O OMCS original foi influenciado pelo website Everything2 e seu antecessor, e apresentou uma interface minimalista que foi inspirada pelo Google.  

Push Singh foi escalado para se tornar professor no MIT Media Lab para liderar o grupo Common Sense Computing em 2007 até seu suicídio na terça-feira, 28 de fevereiro de 2006. O projeto é atualmente executado pelo Digital Intuition Group no MIT Media Lab, sob Catherine Havasi.   

Entenda o website e a base dados

Existem muitos tipos diferentes de conhecimento no OMCS. Algumas declarações transmitem relações entre objetos ou eventos, expressos como frases simples de linguagem natural: alguns exemplos incluem “Um casaco é usado para manter quente”, “O sol é muito quente”, e “A última coisa que você faz quando cozinha o jantar é lave seus pratos “.

O banco de dados também contém informações sobre o conteúdo emocional das situações, em declarações como “Passar tempo com amigos provoca felicidade” e “Entrar em um acidente de carro deixa alguém com raiva”. OMCS contém informações sobre os desejos e metas das pessoas, grandes e pequenas, como “As pessoas querem ser respeitadas” e “As pessoas querem um bom café”.  

Originalmente, essas declarações podiam ser inseridas no site como frases irrestritas de texto, que precisavam ser analisadas mais tarde. A versão atual do site coleta conhecimento apenas usando modelos de preenchimento em branco mais estruturados. OMCS também faz uso de dados coletados pelo Jogo Com um Propósito “Verbosidade”.    

Em sua forma nativa, o banco de dados OMCS é simplesmente uma coleção dessas frases curtas que transmitem algum conhecimento comum. Para usar este conhecimento computacionalmente, ele precisa ser transformado em uma representação mais estruturada.  

Entenda mais sobre ConceptNet

ConceptNet é uma rede semântica baseada nas informações do banco de dados do OMCS. O ConceptNet é expresso como um grafo direcionado cujos nós são conceitos e cujas arestas são afirmações do senso comum sobre esses conceitos.

Os conceitos representam conjuntos de frases de linguagem natural intimamente relacionadas, que podem ser frases nominais, frases verbais, frases adjetivas ou orações.  O ConceptNet é criado a partir de asserções de linguagem natural no OMCS, combinando-as com padrões usando um analisador superficial.

As asserções são expressas como relações entre dois conceitos, selecionados a partir de um conjunto limitado de relações possíveis. As várias relações representam padrões de sentença comuns encontrados no corpus do OMCS e, em particular, todo modelo de “preenchimento dos espaços em branco” usado no site de coleta de conhecimento está associado a uma relação específica.   

As estruturas de dados que compõem o ConceptNet foram significativamente reorganizadas em 2007 e publicadas como ConceptNet 3. O grupo Agentes de Software atualmente distribui um banco de dados e uma API para a nova versão 4.0.   

Em 2010, a co-fundadora e diretora da OMCS, Catherine Havasi, com Rob Speer, Dennis Clark e Jason Alonso, criaram a Luminoso, uma empresa de software de análise de texto que se baseia no ConceptNet. Ele usa o ConceptNet como seu principal recurso léxico para ajudar as empresas a compreender e extrair insights de grandes quantidades de dados qualitativos, incluindo pesquisas, análises de produtos e mídias sociais.   

6 – Acesso

Ficou interessado em ensinar seus bots senso comum dos humanos? Acesse essa base de dados do MIT agora mesmo. https://github.com/commonsense/omcs

Esse post foi modificado em 28 de maio de 2021 10:06

This website uses cookies.