Simpósio: enfrentar as escolhas aquando da modelação do risco da escravatura moderna

13 dezembro 2018

Kelly Gleason  | Data Science Lead - Delta 8.7

O trabalho de Pablo Diego-Rosell e Jacqueline Joudo Larsen representa um avanço notável para o estudo científico da escravatura moderna. Em primeiro lugar, através da recolha de dados nacionalmente representativos sobre trabalho forçado e casamento forçado pela Walk Free Foundation, em colaboração com a Gallup World Poll, descobrimos que a base de conhecimentos foi grandemente enriquecida e forneceu aos investigadores os elementos básicos necessários ao 2017 Global Estimates of Modern Slavery. Em “Modelar o risco da escravatura moderna“, os autores intensificaram a nossa compreensão dos fatores que influenciam a vulnerabilidade da escravatura nos níveis individual e nacional de análise. O exercício de modelação em várias fases apresentado neste artigo mostra um nível impressionante de rigor técnico, expandindo o horizonte das abordagens metodológicas na área da escravatura moderna.

Como em todos os modelos de qualquer fenómeno, os investigadores enfrentam escolhas em relação à estratégia empírica e a uma série de limitações baseadas nessas escolhas. Escolher ir além da exploração ou explicação para extrapolação e previsão é uma decisão ousada que pode abrir as portas para novos conhecimentos. Em conjunto com essa inovação, há uma preocupação sobre se a previsão é apropriada ou possível nesta fase inicial, quando o ambiente de dados é tão escasso e desigualmente desenvolvido quanto nessa área específica. Para esse fim, centrei o meu debate nas escolhas dos autores em termos de seleção de modelos e método de estimativa.

Seleção de modelos

Ao selecionar variáveis independentes a incluir num modelo preditivo (ou explicativo), em geral, a abordagem utilizada pelos investigadores quantitativos enquadra-se num dos dois campos: modelação orientada por teoria ou orientada por dados. A abordagem mais clássica nas ciências sociais é orientada pela teoria. Construímos modelos do mundo que reduzem toda a complexidade a fim de isolar os principais mecanismos de causalidade que supomos ser responsáveis pela mudança nos fenómenos que desejamos prever, neste caso, o risco da escravatura moderna. Normalmente, temos uma ideia sobre as principais influências que são declaradas nas nossas suposições. Estas influências são medidas e testadas dentro de modelos com muitas outras variáveis que supostamente têm algum efeito sobre os fenómenos ou resultados de interesse.

Mais recentemente, com velocidades de computação cada vez maiores, a utilização de dados para encontrar a resposta a perguntas tornou-se muito mais exploratória e menos impulsionada por histórias sobre como vemos o mundo. Sem dúvida que não há nada fundamentalmente errado em adotar uma abordagem exploratória mais indutiva para a seleção de modelos. Pode ser mais complicado do que as abordagens orientadas por dados para entender por que uma característica ou fator influencia o resultado. A vantagem adicional da abordagem orientada por dados é que não depende do modo como um indivíduo ou instituição vê o mundo. Em vez disso, a seleção do melhor modelo de previsão baseia-se em evidências estatísticas de adequação de modelos.

A estratégia de seleção de modelos apresentada no artigo adota uma abordagem intermediária. Enquanto o instrumento Gallup World Survey recolhe informações sobre 157 variáveis, existem muitas opções para estabelecer um modelo. A abordagem adotada por Diego-Rosell e Larson é avaliar a correlação de cada variável com o casamento forçado ou o trabalho forçado e, em seguida, descartar as variáveis uma a uma, se um efeito significativo não for aparente. Na fase seguinte, as variáveis encontradas para ter uma correlação bivariada significativa com o trabalho forçado ou o casamento forçado são inseridas em grupos e aqueles considerados insignificantes são excluídos.

O problema com a abordagem é que as variáveis podem parecer não ter correlação entre si, porque a relação entre elas é mais complexa, possivelmente não linear ou interativa. Além disso, ao incluir variáveis num modelo, o efeito no resultado é amplamente dependente das outras variáveis que também estão incluídas no lado direito do modelo. Assim, por exemplo, se a idade tiver sido incluída como um preditor num modelo com outras características, como anos de escolaridade, rendimentos ou preferência política, a influência da idade pode ser eliminada pelos efeitos de outras variáveis. A idade pode então ser descartada como uma característica não influente quando realmente prevê um resultado bem favorável.

Dito isto, parece extremamente improvável que essa investigação tecnicamente completa cometa erros óbvios como o meu exemplo. No entanto, a justificação da seleção de modelos seria fortalecida pela adesão à abordagem de modelação mais tradicional informada por uma teoria mais robusta, que os autores reconhecem, ou utilizando técnicas de seleção de modelos orientadas por dados, mais avançadas, como várias abordagens de cálculo de média de modelos ou a seleção totalmente automatizada de modelos utilizando métodos de regressão ou a modelação de floresta aleatória.

Técnica de estimação

A opção de utilizar uma estimativa bayesiana, em vez da abordagem frequentista mais comum, baseada no teste de hipóteses, requer uma melhor explicação.

As estatísticas bayesianas diferem das estatísticas frequentistas, pois têm a capacidade de incorporar informações prévias sobre o mundo, o que parece atraente. Podemos supor que o género tem uma influência sobre o risco de casamento forçado. Na abordagem frequentista, a hipótese nula—o género não tem influência sobre o casamento forçado—é considerada verdadeira até que tenhamos evidências em contrário. Uma abordagem bayesiana baseia-se em informações prévias que sugerem que o género tem essa influência.

A utilização correta da modelação bayesiana é, portanto, baseada na existência de informações prévias sólidas. Temos informações prévias sólidas suficientes sobre o risco da escravatura moderna que justifiquem a utilização destas informações para orientar os modelos de risco? Acho que seria difícil convencer os investigadores neste espaço que existe e que a abordagem não é tendenciosa. Os autores também salientam que os resultados da modelação bayesiana se alinham com a versão frequentista dos modelos hierárquicos. Se a modelação menos complexa causar o mesmo efeito, a abordagem bayesiana não é necessária e pode até mesmo complicar a análise, a interpretação e a comunicação dos resultados.

Conclusão

A tentativa de apresentar resultados de um modelo inovador, seja sobre previsões explicativas ou vizinhas, sobre o risco de escravatura, é um passo fundamental para saber mais sobre quais indivíduos podem exigir maiores proteções sociais, quais comunidades podem ser mais vulneráveis e quais países podem enfrentar os maiores desafios. Ampliar o modelo para tirar conclusões sobre países onde a informação é muito limitada apresenta desafios. Os autores são, conforme apropriado, muito transparentes sobre as limitações do artigo.

Continuar a análise apesar dos ambientes de dados imperfeitos incentivou a utilização de novas proxies, variáveis instrumentais e uma variedade de abordagens de modelação estatística. Inovar na procura da estimativa de riscos individuais à escravatura moderna está avançar no domínio. Desde que as atuais limitações sejam apresentadas com clareza, para que possamos tentar superá-las, estou confiante de que as investigações futuras no domínio se desenvolverão a partir desse importante e inovador trabalho.

Este artigo foi preparado como parte do simpósio de modelação do risco da escravatura moderna da Delta 8.7. Leia todas as respostas aqui.

A Dra. Kelly Gleason é a Responsável Científica da Delta 8.7.

Este artigo foi escrito pela Dra. Kelly Gleason, enquanto contribuinte para a Delta 8.7. Tal como previsto nos Termos e condições de utilização da Delta 8.7, as opiniões expressas neste artigo correspondem às opiniões do(s) autor(es) e não refletem necessariamente as opiniões da UNU ou dos respetivos parceiros.

O Fórum da Delta 8.7
Métodos estatísticos e de medição

A evolução do Relatório Global do UNODC sobre o Tráfico de Pessoas

Fabrizio Sarrica
Continuar a ler
Aplicação da lei

Promovendo fluxos de informação para cumprir a Meta 8.7

Luis Fabiano de Assis
Continuar a ler
Justiça internacional

Criando um projeto de lei contra a escravidão moderna no Canadá

John McKay
Continuar a ler
Aplicação da lei

Creating an Effective, Collaborative Human Trafficking Response with the Available Resources in Rural Communities

Continuar a ler
Economia, regulamentação empresarial e cadeias de abastecimento

Corporate Social Responsibility and the Failure to End Labour Exploitation

Genevieve LeBaron
Continuar a ler
Métodos estatísticos e de medição

Measurement, Action, Freedom: Assessing Government Action to Achieve Target 8.7

Continuar a ler
Etiquetas