Aprendizagem de Máquina vs Aprendizagem Humana Parte 1

Tipos de ML e seus Equivalentes da Teoria da Aprendizagem Humana

The Curious Learner Blocked Desbloquear Seguir Seguindo 22 de dezembro de 2018

As origens do aprendizado de máquina não são fáceis de determinar, pois é um campo que empresta muitas ideias de várias disciplinas para evoluir no que é hoje. Alguns consideram o aprendizado de máquina desenvolvido a partir de estatísticas, já que a maioria de seus métodos são estatisticamente baseados, enquanto outros acreditam que um dos primeiros exemplos de aprendizado de máquina é o trabalho de Arthur Samuel (1959) na criação de um programa de computador que constantemente se atualiza. suas estratégias para se tornar melhor em ganhar [1].

Não obstante, é inegável que o termo “aprendizado de máquina” foi inspirado pela natureza orgânica da melhoria contínua na aprendizagem humana. O processo de aprendizagem humana baseia-se no conhecimento preexistente, em que o conhecimento é modificado ou reforçado para torná-lo mais preciso e, posteriormente, usado para melhorar a tomada de decisões e a resolução de problemas (Lefrancois, 1972) [2].

Neste post, simplificarei os conceitos dos principais tipos de aprendizado de máquina e explique quais são os equivalentes da teoria de aprendizagem humana.

Trending AI Articles:

1. Uma Explicação de Aprendizado de Máquina Curta

2. Redes Neurais Naturais vs. Artificiais

3. AI do povo, pelo povo, para o povo

4. Detecção de rostos com OpenCV e Deep Learning da imagem

Aprendizagem Supervisionada

Na aprendizagem supervisionada , um programa de computador recebe um conjunto de dados de treinamento que é rotulado com valores de saída correspondentes, e uma função será determinada com base nesse conjunto de dados (Kotsiantis et al., 2007) [3]. Essa função, ou algoritmo, será então usada para classificar novos dados para prever seus valores de saída correspondentes, com a suposição de que os novos dados estão de acordo com as regras da função que está sendo usada. Regressão linear, árvores de decisão, floresta aleatória e máquinas de vetores de suporte são algumas técnicas comumente usadas que são, na verdade, exemplos de aprendizado supervisionado.

(Imagem pela Western Digital )

Teoria da Aprendizagem Humana Equivalente

A aprendizagem supervisionada é semelhante à aprendizagem de conceito (Bruner & Austin, 1986), em que uma pessoa é obrigada a classificar novos objetos em categorias existentes, combinando as características dos novos objetos com exemplos nas categorias [4].

Aprendizagem não supervisionada

Na aprendizagem não supervisionada , o conjunto de dados de treinamento não possui nenhum valor de saída correspondente rotulado (Hastie et al., 2009) [5]. Como não há "respostas corretas" para aprender, o objetivo do algoritmo é descobrir quaisquer padrões interessantes que ele possa encontrar nos dados, e novos dados ajudarão a confirmar ou desconfirmar esses padrões que encontrar. Alguns dos exemplos bem conhecidos de aprendizado não supervisionado incluem agrupamento k-means, análise de componentes principais e redes neurais artificiais.

(Imagem pela Western Digital )

Teoria da Aprendizagem Humana Equivalente

Redes neurais artificiais seguem o princípio neuronal do aprendizado de Hebbian , onde o algoritmo se concentra em inputs com propriedades similares, assim como os neurônios que se ativam simultaneamente fortalecem o link sináptico entre si (Sanger, 1989) [6].

Aprendizagem por Reforço

Na aprendizagem de reforço , existem “respostas corretas”, mas os dados de entrada não são emparelhados com os resultados desejados. As “respostas corretas” contêm recompensas numéricas, que o algoritmo precisa maximizar, escolhendo as ações corretas a serem tomadas. Isto é muito semelhante a um rato a navegar através de um labirinto à procura de comida, onde os movimentos errados resultam na punição da fome, e os movimentos certos levam-na para a comida mais depressa.

Essencialmente, o aprendizado por reforço é descobrir o equilíbrio certo entre exploração e exploração , em que a exploração dá certeza na quantidade de recompensa, mas a exploração abre a possibilidade de encontrar recompensas mais altas, ou corre o risco de não receber nenhuma recompensa. O desenvolvimento bem-sucedido da inteligência artificial para jogos abstratos, como damas e Go, baseou-se no conceito de aprendizagem por reforço.

Mouse em labirinto analogia de aprendizagem de reforço.

Teoria da Aprendizagem Humana Equivalente

O aprendizado por reforço é inspirado pelo sistema de recompensa do condicionamento operante (Sutton & Barto, 1998) [7]. O condicionamento operante foi estabelecido por BF Skinner (1938) [8], depois que Edward Thorndike (1927) observou como os gatos aprendem a escapar de uma caixa de quebra-cabeças mais rapidamente após um número repetido de tentativas [9]. Thorndike observou que os comportamentos que ajudaram os gatos a escapar foram repetidos com mais frequência ao longo do tempo em comparação com comportamentos que não o fizeram, e ele chamou isso de lei do efeito .

Skinner também criou uma câmara para ratos e pombos, onde uma alavanca entregou uma recompensa enquanto outra administrou um choque. Ele descobriu que quando os animais começaram a identificar o que cada alavanca fazia, a pressão da alavanca de recompensa era reforçada e a frequência do comportamento aumentava. Por outro lado, a punição resultou na diminuição da alavanca de choque sendo pressionada.

* * * * * * * * * *

Ao comparar o aprendizado de máquina com as teorias da aprendizagem humana, os conceitos se tornam menos estranhos e menos difíceis de entender. Mas obviamente, ainda existem algumas diferenças fundamentais entre os dois, que é essencialmente o obstáculo que está impedindo a inteligência artificial de se tornar mais parecida com a inteligência geral que os humanos possuem. No próximo artigo, discutirei sobre essas diferenças e por que o estado atual da inteligência artificial é diferente da inteligência humana.

Se você quiser saber mais sobre as diferenças entre aprendizado de máquina e aprendizado humano, confira a segunda parte desta série:

Aprendizagem de Máquina versus Aprendizagem Humana – Parte 2
Por que o ML é diferente do Human Learning ?

Referências:

  1. Samuel, AL (1959). Alguns estudos em aprendizado de máquina usando o jogo de damas. Revista IBM de pesquisa e desenvolvimento , 3 (3), 210–229.
  2. Lefrancois, GR (1972). Teorias psicológicas e aprendizagem humana: relatório de Kongor . Monterey CA: Brooks / Cole.
  3. Kotsiantis, SB, Zaharakis, I., e Pintelas, P. (2007). Aprendizado de máquina supervisionado: Uma revisão de técnicas de classificação.
  4. Bruner, JS, & Austin, GA (1986). Um estudo do pensamento . Editores de Transação.
  5. Hastie, T., Tibshirani, R., & Friedman, J. (2009). Aprendizado não supervisionado. Em Os elementos da aprendizagem estatística (pp. 485-585). Springer Nova York.
  6. Sanger, TD (1989). Ótimo aprendizado não supervisionado em uma rede neural feedforward linear de camada única. Redes neurais , 2 (6), 459–473.
  7. Sutton, RS, & Barto, AG (1998). Aprendizagem de reforço: Uma introdução (Vol. 1, ?1). Cambridge: imprensa do MIT.
  8. Thorndike, EL (1927). A lei do efeito. O American Journal of Psychology , 39 (1/4), 212-222.
  9. Skinner, BF (1938). O comportamento dos organismos: uma análise experimental . D. Appleton-Century Company Incorporated.