Rumo à Ciência dos Dados Sociais

Com grande quantidade vem grande responsabilidade

Alex Moltzau Segue 19 de jul · 6 min ler

Combinar ciência social e ciência de dados não é uma nova abordagem, mas depois de várias revelações (e multas consideráveis), grandes empresas de tecnologia estão despertando para descobrir onde estão situadas. Parece que os institutos de pesquisa, particularmente na Europa, estão felizes em facilitar essa mudança. Este artigo é (1) uma definição ampla de ciência de dados; (2) uma rápida olhada na ciência de dados sociais; (3) uma visão superficial de quão nova, em termos relativos, a disciplina da ciência de dados sociais é neste momento.

1. Ciência de Dados Amplamente Definida

Vamos primeiro considerar o que é a ciência de dados e, em seguida, prosseguir para o porquê dessa nova terminologia somar social é um acréscimo útil. Como um breve aviso não estou afirmando que a ciência de dados é ignorante de questões sociais, não é social ou tem insights importantes. Pelo contrário, é um campo particular de pesquisa com uma área que pode ser complementada ou misturada com outras disciplinas.

A ciência de dados é um campo multidisciplinar que utiliza métodos, processos, algoritmos e sistemas científicos para extrair conhecimento e insights de dados estruturados e não estruturados.

Pode ser definido mais especificamente como alguém que possui um forte conjunto de habilidades de três funções complementares:

  • Analista especialista
  • Engenheiro de aprendizado de máquina
  • Estatístico

No entanto, a engenharia de pesquisa e o cientista de dados podem ser usados. Parece que o Instituto Alan Turing abrange os dois modelos .

No início deste ano, alguns escritores da Towards Data Science fizeram uma pergunta crítica sobre imprecisão e interpretação na ciência de dados. Thomas Nield argumentou que precisava ser dividido em disciplinas especializadas. Cassie Kozyrkov argumentou que havia uma armadilha psicológica na análise de dados, causando problemas de interpretação. Fiquei fascinado ao ver que ambos os artigos usavam a mesma imagem do teste de Rorschach – a percepção do teste de mancha de tinta.

Dois dos meus autores favoritos escrevendo sobre ambiguidade na ciência de dados

O ponto de vista de Cassie era particularmente impressionante: "Você tem certeza de que sua mais recente epifania de dados não é uma aparição disfarçada?" A apofenia passou a implicar uma tendência humana universal a buscar padrões em informações aleatórias. Ela argumentou que a mente faz com borrões de tinta, como acontece com os dados, e uma vez que você tenha uma "percepção", você terá dificuldades para desassociá-la.

O teste de Rorschach é frequentemente questionado como pseudociência e não científico por uma razão. Tirar uma foto clara, trazê-la para pessoas diferentes e usá-la para diagnosticar um problema parece, em retrospectiva, um erro bastante grave. Isso tem sido usado ao longo dos anos em uma variedade de situações, desde tribunais a instituições de saúde mental com conseqüências negativas generalizadas. Nós gostamos de imagens perfeitas, mas elas não causam, em todos os casos, a impressão correta.

2. Ciência de Dados Sociais

Deixe-me dizer o óbvio: a ciência de dados tem um foco diferente da ciência social. Existe um vasto campo de pesquisa existente que a maioria dos cientistas da computação não aprende nem foca. Construir o conjunto de habilidades como engenheiro de computação ou programador demanda tempo e muito esforço, e há vários subcampos nessa área, mas há tradições que podem diferir .

A ciência social é uma categoria de disciplinas acadêmicas, preocupada com a sociedade e as relações entre indivíduos dentro de uma sociedade. A ciência social como um todo tem muitos ramos. Essas ciências sociais incluem, mas não se limitam a: antropologia, arqueologia, estudos de comunicação, economia, história, musicologia, geografia humana, direito, lingüística, ciência política, psicologia, saúde pública e sociologia.

Novamente citando Carrie em outro artigo, este escrito no dia 26 de julho em Top 10 Roles em IA e Data Science , ela lista o cientista social como número 8:

“Não percebemos quão valiosos são os cientistas sociais. Eles geralmente são mais bem equipados do que os cientistas de dados para traduzir as intuições e intenções de um tomador de decisões em métricas concretas ”.

Engenheiro Chefe de Inteligência de Decisões no Google Cassie Kozyrkov

Sua visão, no entanto, parece baseada no cientista social, sem nenhum ou pequeno conhecimento em relação à programação , significando uma maneira de aumentar a equipe de engenharia. No entanto, isso nos leva à combinação de ciências sociais e ciência da computação.

O Instituto Alan Turing (ATI) é o instituto nacional do Reino Unido para ciência de dados e inteligência artificial, fundado em 2015. É nomeado em homenagem a Alan Turing , matemático britânico e pioneiro da computação, considerado um dos fundadores da ciência da computação. Ciência da Computação é o estudo de processos que interagem com dados e que podem ser representados como dados na forma de programas.

Uma área de pesquisa da ATI é a ciência de dados sociais. Eles buscam abordar os desafios associados a grandes quantidades de dados por meio de dois temas: (1) desenvolver teorias fundamentais do comportamento humano em diversas escalas sociais e temporais; (2) e identificação de desafios metodológicos e soluções para permitir que a ciência de dados sociais forneça resultados robustos e confiáveis nos principais domínios de aplicação.

Seus objetivos são:

  • Crie uma massa crítica de cientistas sociais, cientistas de dados e cientistas de dados sociais
  • Construir relacionamentos com infra-estrutura de dados e treinamento de investimentos e formuladores de políticas por meio de reuniões regulares envolvendo interessados acadêmicos, comerciais, ONGs e governos.

Existem cursos de mestrado em três universidades que conheço até agora. Uma é a Universidade de Oxford , a Escola de Economia e Ciência Política de Londres e a Universidade de Copenhague . A descrição da ciência de dados sociais no site da Universidade de Copenhague é a seguinte:

A ciência de dados sociais é uma nova disciplina que combina as ciências sociais e a ciência da computação, na qual a análise de big data está vinculada à teoria e análise científica social.

Os campos de estudo em relação à ciência de dados sociais são numerosos. Podem basear-se tanto nos dados digitais recolhidos, por exemplo, nas redes sociais, dados de registo, dados de clientes ou noutros tipos de traços digitais de que as pessoas abandonam, por exemplo, o uso pessoal da Internet, o uso de telefones inteligentes e de outros serviços digitais. Esses enormes conjuntos de dados também podem ser combinados com dados qualitativos coletados por meio de trabalho de campo antropológico, etc.
Universidade de Copenhague, Faculdade de Ciências Sociais recuperada em 19 de julho

3. Quão nova é a disciplina da ciência de dados sociais?

Bem, não há nenhuma página sobre o tema na Wikipedia a partir de 19 de julho de 2019.

No momento em que escrevo, há apenas um artigo sobre Medium mencionando ciência de dados sociais que pude identificar com essa pesquisa. Este artigo foi escrito no ano passado, e pode haver muito mais sobre esse assunto agora do que presumo.

Foto tirada a 19 de julho de 2019

O pensamento de combinar ciência de dados com teoria das ciências sociais não é necessariamente uma nova abordagem. No entanto, a combinação da ciência da computação e da ciência social dessa maneira talvez possa representar uma forma de novidade interessante – digna de exploração.