Artigos

8.7: Dimensões teóricas da hierarquia dos grafos de Krackhardt - Matemática


A incorporação de atores em díades, tríades, bairros, clusters e grupos são formas pelas quais a estrutura social de uma população pode exibir "textura". Todas essas formas de embutir estruturas falam sobre a questão da "diferenciação horizontal" da população - grupos separados, mas não necessariamente classificados ou desiguais.

Uma forma muito comum de incorporação de atores em estruturas, entretanto, envolve classificações desiguais. As hierarquias, nas quais os indivíduos ou subpopulações não são apenas diferenciados, mas também classificados, são extremamente comuns na vida social. O grau de hierarquia em uma população fala sobre a questão da "diferenciação vertical".

Embora todos nós tenhamos uma noção intuitiva do que significa para uma estrutura ser uma hierarquia, a maioria concordaria que as estruturas podem ser "mais ou menos" hierárquicas. É necessário ser bastante preciso sobre o significado do termo se quisermos construir índices para medir o grau de hierarquia.

Krackhardt (1994) forneceu uma definição elegante do significado de hierarquia e desenvolveu medidas de cada uma das quatro dimensões componentes do conceito que ele identificou. Krackhardt define uma hierarquia pura, "típica ideal" como um gráfico "fora da árvore". Um gráfico fora da árvore é um gráfico direcionado no qual todos os pontos estão conectados e todos os nós, exceto um (a "saliência") têm um grau em um. Isso significa que todos os atores no gráfico (exceto o "chefe" final) têm um único nó superior. A "hierarquia" mais simples é um gráfico de linha direcionado de A a B a C a D ... Hierarquias mais complexas podem ter "extensões de controle" mais amplas e variáveis ​​(graus externos de pontos).

Essa definição muito simples do tipo puro de hierarquia pode ser desconstruída em quatro condições individualmente necessárias e em conjunto suficientes. Krackhardt desenvolve números de índice para avaliar até que ponto cada uma das quatro dimensões se desvia do tipo ideal puro de uma árvore externa e, portanto, desenvolve quatro medidas da extensão em que uma determinada estrutura se assemelha à hierarquia típica ideal.

1) Conectividade: Para ser uma árvore externa pura, um gráfico deve ser conectado em um único componente - todos os atores estão embutidos na mesma estrutura. Podemos medir até que ponto isso não é verdade observando a proporção do número de pares no gráfico direcionado que são alcançáveis ​​em relação ao número de pares ordenados. Ou seja, que proporção de atores não pode ser alcançada por outros atores? Onde um gráfico tem vários componentes - várias subpopulações não conectadas - a proporção não alcançável pode ser alta. Se todos os atores estiverem conectados no mesmo componente, se houver uma estrutura "unitária", o gráfico é mais hierárquico.

2) Hierarquia: Para ser uma árvore externa pura, não pode haver laços recíprocos. Relações recíprocas entre dois atores implicam igualdade de status e isso nega a hierarquia pura. Podemos avaliar o grau de desvio da hierarquia pura contando o número de pares que têm laços recíprocos em relação ao número de pares em que há empate; ou seja, que proporção de todos os pares empatados têm laços recíprocos.

3) Eficiência: Para ser uma árvore externa pura, cada nó deve ter um grau em um. Ou seja, cada ator (exceto o chefe final) tem um único chefe. Esse aspecto do tipo ideal é denominado "eficiência" porque as estruturas com vários chefes têm comunicação redundante desnecessária de ordens de superiores para subordinados. A quantidade de desvio desse aspecto da árvore externa pura pode ser medida contando a diferença entre o número real de links (menos 1, já que o boss final não tem boss) e o número máximo possível de links. Quanto maior a diferença, maior a ineficiência. Essa dimensão mede então até que ponto os atores têm um "chefe único".

4) Limite superior mínimo (LUB): Para ser uma árvore externa pura, cada par de atores (exceto pares formados entre o chefe final e os outros) deve ter um ator que direcione os laços a ambos - ou seja, o comando deve ser unificado. O desvio de um gráfico desta condição pode ser medido contando o número de pares de atores que não têm uma saliência comum em relação ao número de pares que poderiam (que depende do número de atores e da amplitude de controle do último chefe).

O Rede> Propriedades de rede> Krackhardt GTD os algoritmos calculam os índices de cada uma das quatro dimensões, onde pontuações mais altas indicam maior hierarquia. A Figura 8.13 mostra os resultados para a rede de informações Knoke.

Figura 8.13: Saída de rede> Propriedades de rede> Krackhardt GTD para rede de informações Knoke

A rede de informação forma um único componente, pois há pelo menos um ator que pode atingir todos os outros. Portanto, a primeira dimensão da hierarquia pura - que todos os atores estejam inseridos em uma única estrutura - é satisfeita. Os laços na rede de troca de informações, no entanto, são muito provavelmente recíprocos (pelo menos na medida em que podem ser, dadas as limitações da densidade). Existem vários nós que recebem informações de vários outros, portanto, a rede não é "eficiente". A menor medida do limite superior (a extensão em que todos os atores têm um chefe em comum) relata um valor de 1,25, que pareceria estar fora do intervalo e, francamente, é um quebra-cabeça.


Medida de hierarquia para redes complexas

Natureza, tecnologia e sociedade estão cheias de complexidade decorrente da intrincada teia de interações entre as unidades dos sistemas relacionados (por exemplo, proteínas, computadores, pessoas). Consequentemente, uma das abordagens recentes mais bem-sucedidas para capturar as características fundamentais da estrutura e dinâmica de sistemas complexos tem sido a investigação das redes associadas às unidades (nós) acima, juntamente com suas relações (arestas).

A maioria dos sistemas complexos tem uma organização inerentemente hierárquica e, correspondentemente, as redes por trás deles também exibem características hierárquicas. De fato, vários trabalhos têm se dedicado a descrever esse aspecto essencial das redes, porém, sem resultar em um conceito amplamente aceito e convergente no que diz respeito à caracterização quantitativa do nível de sua hierarquia.

Aqui desenvolvemos uma abordagem e propomos uma quantidade (medida) que é simples o suficiente para ser amplamente aplicável, revela uma série de características universais da organização de redes do mundo real e, como demonstramos, é capaz de capturar as características essenciais do estrutura e o grau de hierarquia em uma rede complexa. A medida que introduzimos é baseada em uma generalização da centralidade do alcance m, que primeiro estendemos para gráficos direcionados / parcialmente direcionados. Em seguida, definimos a centralidade de alcance global (GRC), que é a diferença entre o valor máximo e o valor médio das centralidades de alcance generalizadas sobre a rede.

Investigamos o comportamento do GRC considerando tanto um modelo sintético com um nível de hierarquia ajustável quanto redes reais. Os resultados para redes reais mostram que nossa medida de hierarquia está relacionada à controlabilidade de um determinado sistema. Também propomos um procedimento de visualização para grandes redes complexas que pode ser usado para obter uma imagem qualitativa geral sobre a natureza de sua estrutura hierárquica.

Citação: Mones E, Vicsek L, Vicsek T (2012) Hierarchy Measure for Complex Networks. PLoS ONE 7 (3): e33799. https://doi.org/10.1371/journal.pone.0033799

Editor: Stefano Boccaletti, Universidade Técnica de Madrid, Itália

Recebido: 2 de janeiro de 2012 Aceitaram: 17 de fevereiro de 2012 Publicados: 28 de março de 2012

Direito autoral: © 2012 Mones et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença de Atribuição Creative Commons, que permite o uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original e a fonte sejam creditados.

Financiamento: Este trabalho foi apoiado pelo EU FP7 COLLMOT Grant No: 227878. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta e análise de dados, decisão de publicar ou preparação do manuscrito.

Interesses competitivos: Os autores declararam que não existem interesses conflitantes.


Computação Base Dez

Adicione até 10 usando objetos ou desenhos.

Exemplo de pergunta - clique para visualizar:

Adicione dentro de 5. (sem objetos ou desenhos).

Exemplo de pergunta - clique para visualizar:

Subtraia em 10 usando objetos ou desenhos.

Exemplo de pergunta - clique para visualizar:

Adicione dois números de 1 dígito, some & gt 10.

Exemplo de pergunta - clique para visualizar:

Adicione um número de 2 dígitos e um número de 1 dígito, some 100, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Adicione um número de 2 dígitos e um múltiplo de dez, dentro de 100, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Adicione dois números de 2 dígitos, some 100, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Subtraia múltiplos de dez de múltiplos de dez, até 90.

Exemplo de pergunta - clique para visualizar:

Subtraia um número de 1 dígito de um número de 2 dígitos, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Subtraia múltiplos de dez de um número de 2 dígitos, dentro de 100, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Subtraia em 100, sem reagrupamento.

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Adicione até quatro números de 2 dígitos, com reagrupamento.

Exemplo de pergunta - clique para visualizar:

Corresponde objetos em matrizes retangulares a uma expressão que mostra a adição repetida de adendos iguais.

Exemplo de pergunta - clique para visualizar:

Multiplique 1 dígito por 1 dígito.

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Multiplique 1 dígito por múltiplo de 10 (10-90).

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Adicione números inteiros com vários dígitos & gt 1000.

Exemplo de pergunta - clique para visualizar:

Subtraia números inteiros com vários dígitos & gt 1000.

Exemplo de pergunta - clique para visualizar:

Multiplique o número inteiro de até 4 dígitos por um número inteiro de 1 dígito.

Exemplo de pergunta - clique para visualizar:

Encontre quocientes de números inteiros com dividendos de até quatro dígitos e divisores de um dígito, sem restos.

Exemplo de pergunta - clique para visualizar:

Encontre quocientes de números inteiros e restos com dividendos de até quatro dígitos e divisores de um dígito.

Exemplo de pergunta - clique para visualizar:

Multiplique um número inteiro de 2 dígitos por um número inteiro de 2 dígitos.

Exemplo de pergunta - clique para visualizar:

Localize decimais em centésimos em uma linha numérica.

Exemplo de pergunta - clique para visualizar:

Use a notação decimal para frações com denominadores 10 ou 100.

Exemplo de pergunta - clique para visualizar:

Multiplique números inteiros com vários dígitos (3 ou mais dígitos por 2 ou mais dígitos).

Exemplo de pergunta - clique para visualizar:

Encontre quocientes de números inteiros de números inteiros com dividendos de até 4 dígitos e divisores de 2 dígitos.

Exemplo de pergunta - clique para visualizar:

Avalie as expressões numéricas que usam símbolos de agrupamento.

Exemplo de pergunta - clique para visualizar:

Adicione decimais a centésimos.

Exemplo de pergunta - clique para visualizar:

Subtraia decimais para centésimos.

Exemplo de pergunta - clique para visualizar:

Multiplique decimais por centésimos.

Exemplo de pergunta - clique para visualizar:

Divida os decimais em centésimos.

Exemplo de pergunta - clique para visualizar:

Encontre uma porcentagem de uma quantidade como uma taxa por 100.

Exemplo de pergunta - clique para visualizar:

Divida os números de vários dígitos.

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Subtraia decimais de vários dígitos.

Exemplo de pergunta - clique para visualizar:

Multiplique decimais de vários dígitos.

Exemplo de pergunta - clique para visualizar:

Divida decimais de vários dígitos.

Exemplo de pergunta - clique para visualizar:

Determine o todo quando dado uma parte e uma porcentagem, em um contexto.

Exemplo de pergunta - clique para visualizar:

Avalie expressões numéricas envolvendo bases de números inteiros com expoentes de números inteiros.

Exemplo de pergunta - clique para visualizar:

Calcule o quadrado de uma casa decimal.

Exemplo de pergunta - clique para visualizar:

Calcule o cubo de um decimal.

Exemplo de pergunta - clique para visualizar:

Reescreva a soma de dois números inteiros usando a propriedade distributiva para fatorar o maior fator comum.

Exemplo de pergunta - clique para visualizar:

Adicione dois inteiros (ambos negativos ou um positivo e um negativo).

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Adicione e subtraia três ou mais números inteiros com vários sinais.

Exemplo de pergunta - clique para visualizar:

Multiplique dois números inteiros (ambos negativos ou um positivo e um negativo).

Exemplo de pergunta - clique para visualizar:

Divida dois inteiros (ambos negativos ou um positivo e um negativo).

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Identifique a fatoração primária de um determinado número inteiro.

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Encontre raízes quadradas de pequenos quadrados perfeitos de números inteiros.

Exemplo de pergunta - clique para visualizar:

Encontre raízes cúbicas de pequenos cubos perfeitos de números inteiros.

Exemplo de pergunta - clique para visualizar:

Exemplo de pergunta - clique para visualizar:

Encontre raízes quadradas de pequenos quadrados perfeitos de números racionais positivos na forma decimal.

Exemplo de pergunta - clique para visualizar:

Encontre raízes cúbicas de pequenos cubos perfeitos de números racionais positivos na forma decimal.

Exemplo de pergunta - clique para visualizar:

Avalie expressões numéricas complexas envolvendo números com sinais, decimais, expoentes inteiros, etc.

Exemplo de pergunta - clique para visualizar:


Abstrato

A análise de redes sociais é um método sociológico cada vez mais popular, usado para descrever e compreender os aspectos sociais dos padrões de comunicação no setor de saúde. As redes estudadas nesta área são especiais porque são pequenas e, para esses tamanhos, as métricas calculadas durante a análise são sensíveis ao número de pessoas na rede e à densidade da comunicação observada. A validação é de particular valor para controlar esses fatores e auxiliar na interpretação precisa das descobertas da rede, embora tais abordagens raramente sejam aplicadas. Nosso objetivo neste artigo foi reunir estudos de caso publicados para demonstrar como uma técnica de validação proposta fornece uma base para a comparação padronizada de redes dentro e entre os estudos. Uma validação é realizada para três estudos de rede compreendendo dez redes, onde os resultados são comparados dentro e entre os estudos em relação a uma linha de base padrão. Os resultados confirmam que as métricas de hierarquia, centralização e agrupamento são altamente sensíveis a mudanças de tamanho ou densidade. Entre os três estudos de caso, encontramos suporte para algumas conclusões e evidências contrárias para outras. Esta abordagem de validação é uma ferramenta para identificar recursos adicionais e verificar as conclusões alcançadas em estudos observacionais de pequenas redes. Fornecemos uma base metodológica a partir da qual podemos realizar comparações intraestudo e interestudo, com o objetivo de introduzir maior rigor no uso da análise de redes sociais em aplicações de saúde.

Luzes

► A análise de redes sociais de pequenas redes é problemática ao comparar redes de diferentes tamanhos ou densidades. ► A densidade e o tamanho da rede confundem as métricas de rede agregadas, o que leva a interpretações errôneas em estudos de caso publicados. ► A comparação entre redes de diferentes tamanhos ou densidades é possível usando uma linha de base de rede aleatória simulada. ► O método é uma forma de comparar a força de influência que as restrições sociais têm sobre os padrões de comunicação.


Tipos de gráficos e tabelas e seus usos

Se você está se perguntando quais são as diferenças tipos de gráficos e tabelas , seus usos e nomes, esta página os resume com exemplos e fotos.

Como os diferentes tipos de gráficos visam representar dados, eles são usados ​​em muitas áreas, tais como: em estatísticas, em ciência de dados, em matemática, em economia, em negócios e etc.


Cada tipo de gráfico é uma representação visual de dados em diagramas (por exemplo, barra, pizza, gráfico de linha) que mostram diferentes tipos de tendências de gráfico e relações entre variáveis.

Embora seja difícil dizer quais são todos os tipos de gráficos, esta página consiste em todos os tipos comuns de gráficos e tabelas estatísticas (e seus significados) amplamente usados ​​em qualquer ciência.

1. Gráficos de linha

Um gráfico de linha exibe graficamente dados que mudam continuamente ao longo do tempo. Cada gráfico de linha consiste em pontos que conectam dados para mostrar uma tendência (mudança contínua). Os gráficos de linha têm um eixo xe um eixo y. Na maioria dos casos, o tempo é distribuído no eixo horizontal.

  • Quando você quiser para mostrar tendências. Por exemplo, como os preços das casas aumentaram ao longo do tempo.
  • Quando você quiser fazer previsões com base em um histórico de dados ao longo do tempo.
  • Quando comparando duas ou mais variáveis, situações e informações diferentes em um determinado período de tempo.

O gráfico de linha a seguir mostra as vendas anuais de uma determinada empresa pelo período de seis anos consecutivos:

Nota: o exemplo acima está com 1 linha. No entanto, um gráfico de linha pode comparar várias tendências por várias linhas de distribuição.

2. Gráficos de barras

Os gráficos de barras representam dados categóricos com barras retangulares (para entender o que são dados categóricos, consulte exemplos de dados categóricos). Os gráficos de barras estão entre os tipos mais populares de gráficos e tabelas em economia, estatística, marketing e visualização na experiência digital do cliente. Eles são comumente usados ​​para comparar várias categorias de dados.

Cada barra retangular tem comprimento e altura proporcionais aos valores que representam.

Um eixo do gráfico de barras apresenta as categorias que estão sendo comparadas. O outro eixo mostra um valor medido.

  • Quando você deseja exibir dados agrupados em categorias nominais ou ordinais (ver dados nominais vs ordinais).
  • Para comparar dados entre diferentes categorias.
  • Os gráficos de barras também podem mostrar amplamudanças de dados hora extra.
  • Os gráficos de barras são ideais para visualizar a distribuição de dados quando temos mais de três categorias.

O gráfico de barras abaixo representa a soma total das vendas do Produto A e do Produto B ao longo de três anos.

As barras são de 2 tipos: verticais ou horizontais. Não importa o tipo que você usará. O acima é um tipo vertical.

3. Gráficos de pizza

Quando se trata de tipos estatísticos de gráficos e tabelas, o gráfico de pizza (ou o gráfico de círculo) tem um lugar e significado cruciais.Ele exibe dados e estatísticas em um formato & # 8216pie-slice & # 8217 fácil de entender e ilustra a proporção numérica.

Cada fatia da pizza é relativa ao tamanho de uma categoria específica em um determinado grupo como um todo. Dito de outra forma, o gráfico de pizza divide um grupo em pedaços menores. Mostra relações parte-todo.

Para fazer um gráfico de pizza, você precisa de uma lista de variáveis ​​categóricas e variáveis ​​numéricas.

  • Quando você deseja criar e representar a composição de alguma coisa.
  • É muito útil para exibir nominal ou ordinal categorias de dados.
  • Para mostrar porcentagem ou dados proporcionais.
  • Quando comparando áreas de crescimento dentro de um negócio como o lucro.
  • Os gráficos de pizza funcionam melhor para exibir dados para 3 a 7 categorias.

O gráfico de pizza abaixo representa a proporção dos tipos de transporte usados ​​por 1000 alunos para ir à escola.

Os gráficos de pizza são amplamente usados ​​por profissionais de marketing orientados a dados para exibir dados de marketing.

4. Histograma

Um histograma mostra dados contínuos em colunas retangulares ordenadas (para entender o que são dados contínuos, consulte nossos dados pós-discretos vs. contínuos). Normalmente, existem sem lacunas entre as colunas.

O histograma exibe uma distribuição de frequência (forma) de um conjunto de dados. À primeira vista, os histogramas se parecem com os gráficos de barras. No entanto, existe uma diferença fundamental entre eles. O gráfico de barras representa dados categóricos e o histograma representa dados contínuos.

  • Quando os dados são contínuos.
  • Quando você deseja representar a forma do distribuição de dados.
  • Quando você deseja ver se as saídas de dois ou mais processos são diferentes.
  • Para resumir grandes conjuntos de dados graficamente.
  • Para comunicar a distribuição de dados rapidamente a outras pessoas.

O histograma abaixo representa a renda per capita para cinco grupos de idade.

Os histogramas são amplamente usados ​​em estatística, negócios e economia.

5. Gráfico de dispersão

O gráfico de dispersão é um diagrama X-Y que mostra uma relação entre duas variáveis. Ele é usado para plotar pontos de dados em um eixo vertical e horizontal. O objetivo é mostrar o quanto uma variável afeta a outra.

Normalmente, quando existe uma relação entre 2 variáveis, a primeira é denominada independente. A segunda variável é chamada de dependente porque seus valores dependem da primeira variável.

Os gráficos de dispersão também ajudam a prever o comportamento de uma variável (dependente) com base na medida da outra variável (independente).

  • Ao tentar descobrir se há um relação entre 2 variáveis.
  • Prever o comportamento da variável dependente com base na medida da variável independente.
  • Ao ter dados numéricos emparelhados.
  • Ao trabalhar com ferramentas de análise de causa raiz para identificar o potencial de problemas.
  • Quando você deseja apenas visualizar a correlação entre 2 grandes conjuntos de dados sem levar em conta o tempo.

O gráfico de dispersão abaixo apresenta dados de 7 lojas online, suas vendas mensais de comércio eletrônico e custos de publicidade online no último ano.

A linha laranja que você vê no gráfico é chamada de “linha de melhor ajuste” ou “linha de tendência”. Essa linha é usada para nos ajudar a fazer previsões baseadas em dados anteriores.

Os gráficos de dispersão são amplamente usados ​​em ciência de dados e estatística. Eles são uma ótima ferramenta para visualizar modelos de regressão linear.

Mais exemplos e explicações para gráficos de dispersão, você pode ver em nosso post o que mostra um gráfico de dispersão e exemplos de regressão linear simples.

6. Gráfico de Venn

O Diagrama de Venn (também chamado de diagrama primário, diagrama de conjunto ou diagramas lógicos) usa círculos sobrepostos para visualizar as relações lógicas entre dois ou mais grupos de itens.

O Diagrama de Venn é um dos tipos de gráficos e tabelas usados ​​em apresentações científicas e de engenharia, em aplicativos de computador, em matemática e em estatística.

A estrutura básica do diagrama de Venn geralmente consiste em círculos sobrepostos. Os itens na seção de sobreposição têm características comuns específicas. Os itens nas partes externas dos círculos não têm características comuns.

  • Quando você quiser para comparar e contrastar grupos de coisas.
  • Para categorizar ou agrupar itens.
  • Ilustrar relações lógicas de vários conjuntos de dados.
  • Para identificar todas as relações possíveis entre coleções de conjuntos de dados.

O seguinte exemplo científico do diagrama de Venn compara as características de pássaros e morcegos.

7. Gráficos de área

Os gráficos de área mostram a mudança em uma ou várias quantidades ao longo do tempo. Eles são muito semelhantes ao gráfico de linhas. No entanto, a área entre o eixo e a linha geralmente é preenchida com cores.


Apesar dos gráficos de linha e área suportarem o mesmo tipo de análise, eles nem sempre podem ser usados ​​de forma intercambiável. Os gráficos de linha são freqüentemente usados ​​para representar vários conjuntos de dados. Os gráficos de área não podem mostrar vários conjuntos de dados claramente porque os gráficos de área mostram uma área preenchida abaixo da linha.

  • Quando você quiser para mostrar tendências, em vez de expressar valores específicos.
  • Mostrar uma comparação simples da tendência dos conjuntos de dados ao longo do período.
  • Mostrar a magnitude de uma mudança.
  • Para comparar um pequeno número de categorias.

O gráfico de área tem 2 variantes: uma variante com gráficos de dados sobrepostos e uma variante com gráficos de dados empilhados um sobre o outro (conhecido como gráfico de área empilhado & # 8211 conforme mostrado no exemplo a seguir).

O gráfico de área abaixo mostra as vendas trimestrais das categorias de produtos A e B no último ano.

Este gráfico de área mostra uma comparação rápida da tendência nas vendas trimestrais do Produto A e do Produto B no período do ano passado.

8. Gráfico Spline

O gráfico Spline é um dos tipos mais difundidos de gráficos e tabelas usados ​​em estatísticas. É uma forma de gráfico de linha que representa curvas suaves através dos diferentes pontos de dados.

Os gráficos spline possuem todas as características de um gráfico de linha, exceto que os gráficos spline possuem uma linha curva ajustada para unir os pontos de dados. Em comparação, os gráficos de linha conectam pontos de dados com linhas retas.

  • Quando você deseja plotar dados que requerem o uso de ajuste de curva, como um gráfico do ciclo de vida do produto ou um gráfico de impulso-resposta.
  • Os gráficos spline são frequentemente usados ​​em projetando gráficos de Pareto.
  • O gráfico spline também é frequentemente usado para modelagem de dados ao limitar o número de pontos de dados e estimar os valores intermediários.

O seguinte exemplo de gráfico spline mostra as vendas de uma empresa durante vários meses do ano:

9. Gráfico de caixa e bigode

Um gráfico de caixa e bigode é um gráfico estatístico para exibir conjuntos de dados numéricos por meio de seus quartis. Exibe uma distribuição de frequência dos dados.

O gráfico de caixa e bigode ajuda a exibir a dispersão e a assimetria de um determinado conjunto de dados usando o princípio de resumo de cinco números: mínimo, máximo, mediana, quartis inferior e superior. O princípio de "resumo de cinco números" permite fornecer um resumo estatístico para um determinado conjunto de números. Ele mostra o intervalo (números mínimo e máximo), a dispersão (quartis superior e inferior) e o centro (mediana) para o conjunto de números de dados.

Uma figura muito simples de um gráfico de caixa e bigode você pode ver abaixo:

Usos do gráfico de caixa e bigode:

  • Quando você quiser Observar os quartis superiores, inferiores, média, mediana, desvios, etc. para um grande conjunto de dados.
  • Quando você deseja ter uma visão rápida do distribuição de conjunto de dados.
  • Quando voce tem múltiplos conjuntos de dados que vêm de fontes independentes e se relacionam de alguma forma.
  • Quando você precisa comparar dados de diferentes categorias.

A tabela e os gráficos de caixa e bigode abaixo mostram as pontuações dos testes de matemática e literatura para a mesma classe.

Matemáticas3577924355667370
Literatura3543404350607092

Os gráficos Box e Whisker têm aplicações em muitas áreas científicas e tipos de análise, como análise estatística, análise de resultados de teste, análise de marketing, análise de dados e etc.

10. Gráfico de Bolhas

Os gráficos de bolhas são tipos de gráficos muito úteis para fazer uma comparação das relações entre os dados em 3 dimensões de dados numéricos: os dados do eixo Y, os dados do eixo X e dados que descrevem o tamanho da bolha.

Os gráficos de bolhas são muito semelhantes aos gráficos de dispersão XY, mas o gráfico de bolhas adiciona mais funcionalidade e # 8211 uma terceira dimensão de dados que pode ser extremamente valiosa.

Ambos os eixos (X e Y) de um gráfico de bolhas são numéricos.

  • Quando você tem que mostrar três ou quatro dimensões De dados.
  • Quando você quer comparar e mostrar os relacionamentos entre círculos categorizados, pelo uso de proporções.

O gráfico de bolhas abaixo mostra a relação entre custo (eixo X), lucro (eixo Y) e probabilidade de sucesso (%) (tamanho da bolha).

11. Pictogramas

O pictograma ou um pictograma é um dos tipos de gráficos e tabelas mais atraentes visualmente que exibem informações numéricas com o uso de ícones ou símbolos de imagem para representar conjuntos de dados.

Eles são muito fáceis de ler de forma estatística de visualização de dados. Um pictograma mostra a frequência dos dados como imagens ou símbolos. Cada imagem / símbolo pode representar uma ou mais unidades de um determinado conjunto de dados.

  • Quando seu público prefere e entende melhor exibições que incluem ícones e ilustrações. A diversão pode promover a aprendizagem.
  • É habitual que os infográficos usem um pictograma.
  • Quando você quiser comparar dois pontos de uma forma emocionalmente poderosa.

A imagem a seguir representa o número de computadores vendidos por uma empresa comercial no período de janeiro a março.

O exemplo pictográfico acima mostra que em janeiro são vendidos 20 computadores (4 & # 2155 = 20), em fevereiro são vendidos 30 computadores (6 & # 2155 = 30) e em março são vendidos 15 computadores.

12. Dot Plot

Gráfico de pontos ou gráfico de pontos é apenas um dos muitos tipos de gráficos e tabelas para organizar dados estatísticos. Ele usa pontos para representar os dados. Um gráfico de pontos é usado para conjuntos de dados relativamente pequenos e os valores se enquadram em várias categorias discretas.

Se um valor aparecer mais de uma vez, os pontos serão ordenados um acima do outro. Dessa forma, a altura da coluna de pontos mostra a frequência desse valor.

  • Para traçar contagens de frequência quando você tiver um pequeno número de categorias.
  • Os gráficos de pontos são muito úteis quando a variável é quantitativo ou categórico.
  • Gráficos de pontos também são usados ​​para dados univariados (dados com apenas uma variável que você pode medir).

Suponha que você tenha uma classe de 26 alunos. Eles são solicitados a dizer sua cor favorita. O gráfico de pontos abaixo representa suas escolhas:

É óbvio que o azul é a cor preferida pelos alunos desta turma.

13. Gráfico de radar

Um gráfico de radar é um dos tipos mais modernos de gráficos e tabelas & # 8211 ideal para comparações múltiplas. Os gráficos de radar usam uma tela circular com vários eixos quantitativos diferentes que se parecem com raios de uma roda. Cada eixo mostra uma quantidade para um valor categórico diferente.

Os gráficos de radar também são conhecidos como gráficos de aranha, gráficos da web, gráficos de estrelas, polígonos irregulares, gráficos polares, gráficos de teia de aranha ou diagrama de Kiviat.

O Radar Chart tem muitas aplicações hoje em dia em estatística, matemática, negócios, análise esportiva, inteligência de dados e etc.

  • Quando você deseja observar quais variáveis ​​têm valores semelhantes ou se existem outliers entre cada variável.
  • Representar comparações múltiplas.
  • Quando você deseja ver quais variáveis ​​estão com pontuação baixa ou alta em um conjunto de dados. Isso torna o gráfico de radar ideal para exibindo desempenho.

Por exemplo, podemos comparar o desempenho do funcionário & # 8217s com a escala de 1 a 8 em assuntos como pontualidade, resolução de problemas, prazos de cumprimento, conhecimento de marketing, comunicações. Um ponto mais próximo do centro de um eixo mostra um valor inferior e um desempenho pior.

RótuloPontualidadeSolução de problemasCumprimento de prazosConhecimento de MarketingComunicações
Jane65878
Samanta75548

É óbvio que Jane tem um desempenho melhor do que Samanta.

14. Gráfico de pirâmide

Quando se trata de gráficos e tabelas fáceis de entender e de boa aparência, o gráfico de pirâmide ocupa um lugar de destaque.

Um gráfico de pirâmide é um gráfico em forma de pirâmide ou triângulo. Esses tipos de gráficos são melhores para dados organizados em algum tipo de hierarquia. Os níveis mostram uma ordem progressiva.

  • Quando você quiser para indicar uma hierarquia nível entre os tópicos ou outros tipos de dados.
  • O gráfico de pirâmide é frequentemente usado para representar ordens progressivas, como: & # 8220 mais antigo para mais recente & # 8221, & # 8220mais importante para menos importante & # 8221, & # 8220 específico para menos específico & # 8221 & # 8216 e etc.
  • Quando você tem um relacionamento proporcional ou interconectado entre conjuntos de dados.

Um exemplo clássico de gráfico de pirâmide é a pirâmide alimentar saudável que mostra que gorduras, óleos e açúcar (no topo) devem ser consumidos menos do que muitos outros alimentos, como vegetais e frutas (na parte inferior da pirâmide).

Você deve saber que escolher o tipo certo de gráfico é uma espécie de negócio complicado.

Praticamente, a escolha depende de 2 coisas principais: do tipo de análise que você deseja realizar e do tipo de dados que possui.


Normalmente, quando pretendemos facilitar uma comparação, usamos um gráfico de barras ou gráfico de radar. Quando queremos mostrar tendências ao longo do tempo, usamos um gráfico de linha ou um gráfico de área e etc.

De qualquer forma, você tem uma grande variedade de tipos de gráficos e tabelas. Usados ​​da maneira certa, eles são uma arma poderosa para ajudá-lo a tornar seus relatórios e apresentações profissionais e claros.

Quais são seus tipos favoritos de gráficos e tabelas? Compartilhe seus pensamentos no campo abaixo.

Sobre o autor

Silvia Valcheva

Silvia Valcheva é uma profissional de marketing digital com mais de uma década de experiência na criação de conteúdo para a indústria de tecnologia. Ela tem uma forte paixão por escrever sobre softwares e tecnologias emergentes, como big data, IA (inteligência artificial), IoT (Internet das coisas), automação de processos, etc.


Complexidade computacional: uma perspectiva quantitativa

5.7 Predicados difíceis

EM RESUMO: Dada uma função hard, pode-se construir efetivamente um predicado hard. O tipo de dureza (dureza criptográfica ou dureza exponencial) é preservado.

Funções de predicado são particularmente interessantes porque modelam problemas de decisão, ou seja, linguagens, que são objetos de grande interesse em complexidade computacional. Além disso, a construção dos geradores pseudo-aleatórios do tipo II que serão apresentados na próxima seção utiliza predicados rígidos como ponto de partida. Consequentemente, nos concentramos nesta seção em predicados difíceis. Lembre-se de que um predicado é uma função cujas saídas só podem ser 0 ou 1. Claramente, qualquer predicado f pode ser calculado corretamente em uma fração de 1 2 das entradas em cada comprimento por circuitos bastante simples. Na verdade, tanto o circuito que dá saída 1 em todas as entradas, ou o circuito que dá saída 0 em todas as entradas, concordará com f em pelo menos metade das entradas. Portanto, ao considerar o desempenho de um circuito que tenta calcular um predicado, apenas o viés de 1 2 é relevante. Conseqüentemente, damos as seguintes definições para a forma geral de um predicado rígido, bem como para duas formas particulares de forte dureza para predicados.

((∈, S) - predicado difícil) Um predicado f: Σ ℓ → <0, 1>é (∈, S) -difícil se para cada circuito C de tamanho S,

(Predicado cripto-hard) Um predicado f: Σ * → <0, 1>é cripto-difícil se houver uma função superpolinomial S para que o seguinte seja válido. Para qualquer polinômio p e para qualquer família de circuitos (C)ℓ∈ℕ de tamanho no máximo S,

(Predicado exponencialmente difícil) Um predicado f: Σ * → <0, 1>é exponencialmente difícil se houver uma constante c de modo que para qualquer família de circuitos (C)ℓ∈ℕ com Tamanho(C) ≤ 2 cl , para todos l,

O próximo resultado mostra que uma função cripto-rígida com preservação de comprimento (difícil exponencial) pode ser convertida em um predicado cripto-rígido (difícil exponencial, respectivamente).

Deixe f: Σ * → Σ * ser uma função de preservação de comprimento que é cripto-difícil. Então existe f′: Σ * → <0, 1>um predicado cripto-rígido. Além disso, f & # x27 pode ser construído efetivamente a partir de f em tempo polinomial.

Deixe f : Σ * → Σ * ser uma função preservadora de comprimento de modo que para alguma constante positiva c e para todos l, f suficientemente grandes é (2 −cl , 2 cl )-duro. Então existe f′: Σ * → <0, 1>um predicado exponencialmente rígido. Além disso, f & # x27 pode ser construído efetivamente a partir de f em tempo polinomial.

Prova. Provamos (a). Deixar p(ℓ) ser um polinômio arbitrário e deixar s(ℓ) ser uma função superpolinomial de modo que para qualquer circuito C do tamanho s(ℓ), para ℓ suficientemente grande,

Estaremos usando mais uma vez códigos de correção de erros. Desta vez, utilizaremos o código de correção de erros Hadamard e tiraremos vantagem de sua propriedade de decodificação de lista (consulte o Teorema 5.3.5). Ou seja, para f(x) de comprimento ℓ, consideramos Had (f(x)) e definir o predicado nas entradas x e r ser o r-ésimo pedaço de Had (f(x)). Se um circuito pode calcular corretamente pelo menos uma fração de 1 2 + 1 p (ℓ) dos bits de Had (f(x)), então, pelo Teorema 5.3.5, podemos produzir uma pequena lista que contém f(x) Ao escolher aleatoriamente um elemento desta lista, temos uma boa chance de recuperar f(x) Isso contradiz a dureza de f.

Prosseguimos agora com a prova formal. Deixar

Claramente, dado acesso ao oracle para f, f′ Pode ser calculado em tempo polinomial. Suponha que haja um circuito C do tamanho s1(ℓ) tal que

Então, uma pequena variação da relação acima é válida para uma fração polinomial de x. De fato, seja B = .

Portanto, para qualquer xB, C(x, r) = f(x) · r por pelo menos uma fração de 1 2 + 1 2 p (ℓ) do r em Σ ℓ. Em outras palavras, se C ¯ denota a string C(x, 0 … 0) … C(x, 1… 1) de comprimento ℓ · 2 ℓ, então a distância de Hamming entre C ¯ e Had (f(x)) é no máximo 1 2 - 1 2 · p (ℓ). Pelo Teorema 5.3.5, existe um circuito probabilístico oráculo UMA′ De tamanho O (ℓ 3 · 1 (2 p (ℓ)) 4) que faz ℓ 2 · (2p(ℓ)) 2 consultas para C (formalmente para a string do oráculo C ¯) com a seguinte propriedade: Para cada xB, com probabilidade de pelo menos 3 4, UMA′ Produz uma lista de ℓ · (2p(ℓ)) 2 + 1 cadeias que inclui f(x) Incorporando o circuito C para dentro UMA′, Temos um circuito probabilístico UMA de tamanho limitado por O(ℓ 3 · (p(ℓ)) 4) · tamanho (C) que, para todos xB, gera uma lista como acima. Nós modificamos ainda mais o circuito UMA para que no final ele escolha aleatoriamente um elemento dessa lista. Com probabilidade de pelo menos 1 4 ℓ · (p (ℓ)) 2 + 1, este elemento é f(x).

Assim, a probabilidade de que o modificado UMA na entrada x computa f(x) é pelo menos

(Aqui, rand denota os bits aleatórios usados ​​pelo circuito UMA) O tamanho de UMA é limitado por s(ℓ) (para uma escolha apropriada da constante c na Equação (5.15)). Já que o polinômio p(ℓ) é arbitrário e s1(ℓ) é superpolinomial, segue-se que f′ É um predicado cripto-rígido.

A prova de (b) é virtualmente idêntica.


ABSTRATO

Existem muitos tipos diferentes de modelos de distribuição de espécies (SDMs) que são amplamente usados ​​no campo da ecologia. Nesta pesquisa, exploramos um novo mecanismo avançado para prever a distribuição de espécies com base na função de pertinência fuzzy, princípio da entropia máxima, avaliação abrangente em matemática fuzzy e a estrutura de redes bayesianas. Usamos matemática difusa e modelo de rede bayesiana (FBM) para simular relações entre habitats das espécies e variáveis ​​ambientais, e a relação pode ser difícil de quantificar de forma eficaz. O FBM, que combina dados de espécies, dados ambientais, experiência especializada e aprendizado de máquina, pode reduzir os dados e erros do sistema. No caso da planta medicinal, Angelica sinensis (Oliv.) Diels, muitas abordagens foram aplicadas, incluindo nove sequências de aprendizagem de locais de amostragem, três modelos FBM, dois tipos de classificação de informação por classificação matemática difusa (FMC) e classificação de intervalo igual (EIC), e a avaliação de AIC e Log probabilidade. Através da comparação dos resultados do raciocínio entre o FBM e o modelo de elemento de matéria difusa (FME) em locais de teste, o resultado mostra que a combinação dos dados objetivos e a estrutura do modelo empírico faz com que o FBM tenha melhor saída de resultados. Além disso, a análise de sensibilidade FBM ajuda os pesquisadores a explorar em detalhes o impacto dos fatores ambientais em cada nível de adequação do habitat das espécies. O fator de temperatura tem uma influência importante nos habitats altamente adequados, moderadamente adequados e pouco adequados de A. sinensis. Através do FMC e da análise de sensibilidade, a temperatura média anual (Bio1) em 5,92 ° C-9,05 ° C e a temperatura média do trimestre mais quente (Bio10) em 14,80 ° C-18,60 ° C são a faixa de temperatura do habitat altamente adequada de A. sinensis.


Estrutura de dados e algoritmos - classificação rápida

A classificação rápida é um algoritmo de classificação altamente eficiente e é baseado no particionamento de array de dados em arrays menores. Uma grande matriz é particionada em duas matrizes, uma das quais contém valores menores do que o valor especificado, digamos pivô, com base na qual a partição é feita e outra matriz mantém valores maiores que o valor pivô.

O Quicksort particiona um array e, em seguida, chama a si mesmo recursivamente duas vezes para classificar os dois subarrays resultantes. Este algoritmo é bastante eficiente para conjuntos de dados de grande porte, pois sua complexidade média e de pior caso são O (n 2), respectivamente.


Uma Progressão de Aprendizagem para Variabilidade

Embora os autores que discutimos tenham desenvolvido seus próprios descritores dos níveis pelos quais muitos alunos passam à medida que adquirem uma compreensão da variabilidade, há muitas semelhanças entre essas idéias. E embora muitos desses autores estejam baseados na Austrália e conduzam suas pesquisas com estudantes australianos, os padrões de matemática do Currículo Australiano (Assessment and Reporting Authority, 2010) são suficientemente semelhantes aos do CCSSM para que possamos combinar sua pesquisa com a pesquisa do Especialistas nos Estados Unidos para desenvolver nosso próprio LP para variabilidade, consulte a Tabela 2. Este LP hipotético tem cinco níveis, os quatro primeiros são baseados no trabalho de Shaughnessy et al. (1999), Torok e Watson (2000), Watson et al. (2003), Reading and Shaughnessy (2000, 2004) e outros. Para três desses níveis, usamos os nomes dados por Watson et al. para o Nível 1, pensamos que “Compreensão ingênua de variabilidade” era um título mais descritivo do que “Pré-requisitos para variação” de Watson et al. Nosso Nível 5 incorpora o trabalho de Peters (2011) sobre uma compreensão robusta da variabilidade. O LP completo é apresentado na Tabela 2, uma visão geral dos cinco níveis a seguir:

Compreensão robusta da variabilidade

Estudantes universitários e professores em serviço

  • Reconheça a existência de variabilidade e a necessidade de desenho do estudo.
  • Antecipe uma variabilidade razoável nos dados.
  • Antecipe e permita uma variabilidade razoável nos dados ao usar modelos.
  • Use o contexto para considerar fontes e tipos de variabilidade para informar e criticar o desenho do estudo.
  • Descreva e meça a variabilidade nos dados para variáveis ​​contextuais como parte da análise exploratória de dados.
  • Identifique o padrão de variabilidade nos dados ou o padrão esperado de variabilidade para variáveis ​​contextuais.
  • Controle a variabilidade ao projetar estudos ou critique até que ponto a variabilidade foi controlada nos estudos.
  • Explore a variabilidade controlada e aleatória para inferir relações entre dados e variáveis.
  • Variabilidade controlada por modelo ou aleatória em dados, dados transformados ou estatísticas simples.
  • Antecipe os efeitos do tamanho da amostra ao projetar um estudo ou ao criticar um projeto de estudo.
  • Examine os efeitos do tamanho da amostra por meio da criação, uso ou interpretação de representações gráficas ou numéricas baseadas em dados.
  • Antecipe os efeitos do tamanho da amostra na variabilidade de uma distribuição amostral.
  • A distribuição das pontuações atribuídas por cada aluno de graduação
  • O desvio padrão das pontuações atribuídas por cada aluno de pós-graduação
  • A gama de pontuações atribuídas por cada aluno de graduação
  • Se os trabalhos foram ou não atribuídos aleatoriamente aos alunos de pós-graduação para avaliação
  • O número de pontuações em cada ponto atribuído por cada aluno de pós-graduação

Aspectos críticos da variabilidade

  • Os alunos neste nível exibem proficiência em redigir argumentos com base no raciocínio proporcional. Por exemplo, quando solicitados a prever o número de balas vermelhas em uma amostra retirada de uma população conhecida, eles focariam sua atenção na proporção de balas vermelhas em vez do número, como resultado, eles provavelmente fariam previsões apropriadas sobre ambos o centro e a disseminação de uma distribuição.
  • Os alunos demonstrarão em suas respostas um grau apropriado de variação com um equilíbrio apropriado entre variação e agrupamento.
  • Os alunos entendem a importância da variabilidade, bem como a importância da tendência central na caracterização de um conjunto de dados.
  • Os alunos são capazes de dar definições sofisticadas de termos técnicos, como amostra, aleatória, e variação (Watson et al., 2003).
  • Os alunos podem fornecer uma análise estatisticamente apropriada de gráficos, eles podem gerar exibições gráficas de dados e usá-los para comparar duas ou mais distribuições (Ben-Zvi, 2004 Watson et al., 2003).
  • É provável que os alunos detectem fontes de viés nas amostras, como a não representatividade.
  • Os alunos podem descrever uma distribuição em termos de desvios de um valor central (média, mediana ou modoReading, 2004 Reading & Shaughnessy, 2000, 2004 Watson et al., 2003).
  • Os alunos têm uma compreensão conceitual do desvio padrão como uma medida de variabilidade.
  • Os alunos podem traduzir entre representações gráficas, numéricas e simbólicas de distribuições.

Os histogramas a seguir representam as distribuições de idades dos dois países. b b Adaptado do Departamento de Educação do Estado de Nova York (2013). CC BY-NC-SS.

  1. Como as formas dos dois histogramas diferem?
  2. Aproximadamente que porcentagem de pessoas no Quênia em 2010 tinha entre 0 e 10 anos?
  3. Aproximadamente, que porcentagem de pessoas nos Estados Unidos em 2010 tinha entre 0 e 10 anos?
  4. Aproximadamente que porcentagem de pessoas no Quênia em 2010 tinha entre 70 e 100 anos?
  5. Aproximadamente, que porcentagem de pessoas nos Estados Unidos em 2010 tinha entre 70 e 100 anos?
  6. A população do Quênia em 2010 era de aproximadamente 41 milhões de pessoas. Aproximadamente quantas pessoas no Quênia tinham entre 0 e 10 anos? Entre 60 e 100 anos?
  7. Se você tivesse visitado uma cidade no Quênia em 2010, você acha que provavelmente teria visto muitos adolescentes? Você provavelmente teria visto muitas pessoas com mais de 70 anos? Explique suas respostas com base no histograma. b b Adaptado do Departamento de Educação do Estado de Nova York (2013). CC BY-NC-SS.

Aplicações de variabilidade

  • Os alunos neste nível terão alguma facilidade com o raciocínio proporcional, mas às vezes produzirão respostas com muita ou pouca variação, o intervalo pode ser insuficientemente agrupado em torno da média ou pode ser agrupado de forma muito compacta em torno da média (Torok & Watson, 2000 Watson et al ., 2003).
  • Os alunos neste nível podem calcular as medidas de tendência central (média, mediana e moda) e dispersão (intervalo e desvio médio absoluto), mas podem não apreciar a importância da variação. Seu entendimento dessas medidas é procedimental e não conceitual, eles não entendem o que as medidas significam ou qual é a distinção entre medidas de centro e medidas de disseminação (Ben-Zvi, 2004 delMas & Liu, 2005 Watson et al., 2003).
  • Os alunos neste nível podem tentar definir termos técnicos como amostra, aleatória, e variação, mas podem contar com exemplos para explicar o significado dos termos (Watson et al., 2003).
  • Os alunos podem ser capazes de fornecer uma análise parcial dos gráficos, enquanto perdem as tendências gerais (Watson et al., 2003).
  • Ao selecionar amostras, os alunos podem se concentrar na representatividade ou aleatoriedade, mas não em ambas.
  • Uma distribuição pode ser descrita em termos de desvios de um valor âncora que não é um valor central (Reading, 2004 Reading & Shaughnessy, 2000, 2004 Watson et al., 2003).
  • Os alunos podem não entender o que é um valor discrepante, pensando que um valor discrepante é o valor menos frequente.

Abaixo estão as alturas das jogadoras da equipe feminina de basquete da Universidade de Maryland para a temporada 2012-2013 e as alturas das jogadoras da equipe feminina de hóquei em campo na temporada de 2012.

  1. Com base na inspeção visual dos dados, qual grupo parece ter a maior altura média? Qual grupo parece ter a maior variabilidade nas alturas?
  2. Calcule a média e o desvio absoluto médio (MAD) para cada grupo. Esses valores apóiam suas respostas na parte (a)?
  3. Quantos dos 12 jogadores de basquete são mais baixos do que o jogador de hóquei em campo mais alto?
  4. Imagine que uma atleta de uma das duas equipes lhe disse que precisa ir praticar. Você estima que ela tenha cerca de 65 centímetros de altura. Se você tivesse que escolher, você pensaria que ela era uma jogadora de hóquei em campo ou de basquete? Explique seu raciocínio.
  5. As mulheres da equipe de hóquei em campo de Maryland não são uma amostra aleatória de todas as jogadoras de hóquei em campo universitárias. Da mesma forma, as mulheres do time de basquete de Maryland não são uma amostra aleatória de todas as jogadoras de basquete universitário do sexo feminino. No entanto, para os fins desta tarefa, suponha que esses dois grupos possam ser considerados amostras aleatórias de todas as jogadoras de hóquei em campo universitárias e de todas as jogadoras de basquete universitário do sexo feminino, respectivamente. Se essas fossem amostras aleatórias, você pensaria que as jogadoras de basquete universitário são geralmente mais altas do que as jogadoras de hóquei em campo? Explique sua decisão usando respostas às perguntas anteriores e / ou análises adicionais.

Reconhecimento parcial de variabilidade

  • Os alunos neste nível provavelmente terão dificuldade com o raciocínio proporcional. Por exemplo, eles podem se concentrar no número de doces vermelhos em uma população em vez da proporção de doces vermelhos. Como resultado, eles podem superestimar o número de balas vermelhas (Torok & Watson, 2000).
  • Os alunos tendem a usar declarações aleatórias não quantificadas para descrever os resultados, como “Qualquer coisa pode acontecer” (Watson et al., 2003).
  • Os alunos podem interpretar o padrão em uma distribuição, mas não podem fazer uma referência específica à variação exibida na distribuição.
  • Termos como amostra, aleatória, e variação são provavelmente familiares, mas os alunos podem não compreender os significados matemáticos precisos desses termos ou podem ter dificuldade em expressar os significados matematicamente precisos desses termos em palavras (Watson et al., 2003).
  • Os alunos podem fazer afirmações que explicam informalmente a variabilidade. Eles podem reconhecer a variação, fornecendo uma gama de números em resposta a uma pergunta, em vez de um valor específico (Torok & Watson, 2000).
  • Os alunos descreverão as características de uma distribuição numericamente. Eles podem apoiar suas afirmações com referências a características específicas nos dados (Reading, 2004).
  • Neste nível, os alunos terão dificuldade em descrever uma distribuição particular.
  • As razões dos alunos não refletem a compreensão do acaso ou variação.
  • A explicação dos alunos sobre a variabilidade exibida nos gráficos pode apresentar falhas (Watson et al., 2003, p. 23).
  • Os alunos desse nível podem calcular o desvio absoluto médio e entender que ele mede a variabilidade em uma população (NGA / CCSSO, 2010).

1. Suponha que temos uma tigela com 100 doces. 20 são amarelos, 50 são vermelhos e 30 são azuis. Suponha que você escolha 10 doces.

Quantos tintos você espera receber? ___

Isso aconteceria todas as vezes? Por quê?

2. Ao todo, seis de vocês fazem este experimento.

O que você acha que provavelmente ocorrerá com o número de balas vermelhas anotadas?

_____, _____, _____, _____, _____, _____

Por que esses números prováveis ​​são para os vermelhos?

  1. 5, 9, 7, 6, 8, 7
  2. 3, 7, 5, 8, 5, 4
  3. 5, 5, 5, 5, 5, 5
  4. 2, 3, 4, 3, 4, 4
  5. 7, 7, 7, 7, 7, 7
  6. 3, 0, 9, 2, 8, 5
  7. 10, 10, 10, 10, 10, 10

Por que você acha que a lista que escolheu melhor descreve o que pode acontecer?

4. Suponha que 6 alunos fizeram o experimento - tiraram 10 balas desta tigela, anotaram o número de tintos, colocaram de volta, misturaram.

De onde você acha que provavelmente virão os números? De _____ (baixo) a _____ (alto) número de tintos.

Compreensão ingênua da variabilidade

  • Os alunos neste nível podem raciocinar a partir de fatores não relacionados à distribuição, podem tentar justificar suas respostas com histórias sobre experiências pessoais ou podem se concentrar em aspectos irrelevantes dos dados (Ben-Zvi, 2004 Torok & Watson, 2000 Watson et al ., 2003).
  • Os alunos podem superestimar a variabilidade, talvez porque pensem que todos os resultados possíveis são igualmente prováveis, pois eles têm a ideia de que “tudo pode acontecer” em um experimento ao acaso (Torok & Watson, 2000 Watson et al., 2003).
  • Os alunos reconhecem a variação apenas no contexto simples de “não ter a mesma aparência todos os dias” ou na descrição de um resultado surpreendente (Watson et al., 2003, p. 11).
  • Os alunos neste nível terão um conhecimento insuficiente dos termos técnicos associados à variação (Torok & Watson, 2000).
  • Os alunos podem fazer afirmações informais que não levam em consideração a variabilidade dos dados.
  • Os alunos podem descrever as características de uma distribuição em palavras e não numericamente (Reading, 2004).
  • Os alunos neste nível podem confundir diferentes medidas de tendência central, como média e modo (Torok & Watson, 2000).
  • Os alunos podem ser capazes de ler as informações de um gráfico, mas têm dificuldade em interpretar as informações obtidas em um gráfico ou em integrar as informações obtidas em vários gráficos (Watson et al., 2003).
  • Respostas a perguntas envolvendo acaso podem ser numericamente inadequadas.
  • Os alunos neste nível não terão desenvolvido medidas de variabilidade.

1. Uma classe usou este controle giratório. Em 50 giros, quantas vezes você acha que o botão giratório pousará na parte sombreada? Por que você acha isso?

2. Uma classe de alunos registrou o número de anos que suas famílias moravam em sua cidade. Aqui estão dois gráficos que os alunos desenharam para contar suas histórias (Watson et al., 2003).

uma. O que você pode dizer olhando para o gráfico 1?

b. O que você pode dizer olhando para o gráfico 2?

c. Qual gráfico conta melhor a história? Por quê?

  • a Os descritores e a tarefa neste nível foram adaptados de Peters (2011), figura 13. Copyright 2011 da International Association for Statistical Education.
  • b Adaptado do Departamento de Educação do Estado de Nova York (2013). CC BY-NC-SS.

Nível 5: Compreensão robusta da variabilidade.

Nível 4: Aspectos críticos de variabilidade.

Nível 3: Aplicações de Variabilidade.

Nível 2: Reconhecimento parcial da variabilidade.

Nível 1: Compreensão ingênua da variabilidade.

Quando alinhados com o CCSSM, os níveis 1 a 4 correspondem a uma compreensão da variabilidade apropriada para alunos do ensino fundamental ou médio. Uma pesquisa de English e Watson (2016), no entanto, sugeriu que os alunos já na quarta série podem obter uma compreensão da variabilidade por meio da administração de tarefas cuidadosamente planejadas, e o relatório GAISE (Franklin et al., 2007) sugere que o ensino fundamental os alunos podem usar o intervalo de um conjunto de dados como uma medida de sua propagação. Lehrer e Kim (2009) descobriram que os alunos nas séries 5 e 6, quando envolvidos na modelagem de dados, podem reconhecer e planejar medidas de variabilidade. Portanto, no LP proposto, alinhamos o Nível 1 com as notas anteriores à 6. O Nível 2 se alinha com a 6ª Série, o Nível 3 se alinha com a 7ª Série e o Nível 4 se alinha com o ensino médio. O nível 5 corresponde a um entendimento que pode ser abordado por um estudante universitário avançado de estatística ou professor de estatística em serviço. Esses alinhamentos, no entanto, têm como objetivo apenas demonstrar como os níveis de nosso LP correspondem aos padrões do CCSSM. É preciso também ter em mente a advertência do relatório GAISE. Um aluno da 6ª série que não teve nenhuma instrução anterior em estatística começará no nível 1 antes de progredir para o nível 2, e os alunos do ensino médio não serão capazes de começar o nível 4 até que tenham dominado o nível 3 (Franklin et al., 2007, p. . 13).

Os alunos com um nível de compreensão 1 no LP proposto geralmente fornecem argumentos que são baseados em uma compreensão idiossincrática da variabilidade ou em suas experiências anteriores, e não em uma análise dos dados. Isso foi observado por Torok e Watson (2000), que observaram que os alunos em seu Nível A muitas vezes raciocinam a partir de fatores não relacionados à distribuição de Watson et al. (2003), que observou que os alunos do Nível 1 tendem a justificar respostas com histórias sobre suas experiências pessoais e por Ben-Zvi (2004), para quem os alunos em seu Estágio 1 focam em aspectos irrelevantes dos dados.

Mas nem todos os entendimentos ingênuos são devidos ao uso de informações irrelevantes. Enquanto Shaughnessy et al. (1999) não construíram níveis de desenvolvimento, eles observaram vários estágios na compreensão (ou mal-entendido) dos alunos. Em particular, eles observaram que alguns alunos esperavam uma ampla gama de números possíveis de picolés em uma amostra de 10 picolés, talvez porque os alunos com um baixo nível de compreensão acreditam que os vários resultados possíveis são igualmente prováveis, que tudo pode acontecer em um experimento casual. Isso é consistente com a observação de Torok e Watson (2000) de que os alunos em seu Nível A muitas vezes predizem muita variação, e é em parte responsável pela observação de Watson et al. (2003) de que os alunos em seu Nível 1 dão respostas numericamente inapropriado. Watson et al. também descobriram que os alunos em seu Nível 2 podem fazer afirmações não quantificadas, como “tudo pode acontecer”, para justificar suas conclusões.

Watson et al. (2003) descobriram que os alunos do Nível 1 reconhecem a variação apenas no contexto de "não ter a mesma aparência todos os dias" (p. 11), enquanto Torok e Watson (2000) observaram que os alunos do Nível A tinham pouco conhecimento técnico termos associados à variação. Eles disseram que os alunos de níveis superiores tinham um conhecimento razoável de termos técnicos, mas Watson et al. (2003) esclareceu isso observando que os alunos com um nível de compreensão de nível 2 estão familiarizados com os termos técnicos (em particular, amostra, aleatória, e variação), mas não entendem os significados desses termos, enquanto os alunos com uma compreensão de Nível 3 tentam dar definições desses termos, mas podem recorrer a dar exemplos para explicar seus significados. Somente no Nível 4 os alunos podem dar definições sofisticadas desses termos sem depender de exemplos (Watson et al., 2003).

Reading (2004) estendeu a hierarquia de descrição de Reading e Shaughnessy (2000, 2004) para se aplicar à variabilidade dos dados, bem como à variabilidade da amostra. Ela descobriu que os níveis 1 e 2 da hierarquia de Reading e Shaughnessy (2004) poderiam ser reorganizados em um nível qualitativo e um quantitativo, o primeiro corresponde ao Nível 1 de Watson et al. (2003) e o segundo corresponde a Watson et Al .'s Nível 2. Os alunos com um nível de compreensão 1 descrevem as características de uma distribuição em palavras e não numericamente, enquanto os alunos com um nível 2 de compreensão descrevem as características numericamente. Isso é consistente com a descrição geral do Nível 1 em nosso LP como representando uma compreensão ingênua da variabilidade.

Dificuldades ou equívocos comuns com alunos no Nível 1 de nosso LP incluem a tendência de confundir a média com o modo (pensando na média como o valor mais comum Torok & Watson, 2000), dificuldade de interpretar tabelas e gráficos (Watson et al., 2003), e uma falta de compreensão conceitual do desvio padrão (delMas & Liu, 2005).

Shaughnessy et al. (1999) e Torok e Watson (2000) observaram que, na tarefa de picolés, alguns alunos focaram no número de picolés (50) ao invés da proporção de picolés (metade). Como resultado, eles tendiam a superestimar o número de pirulitos vermelhos. Torok e Watson colocaram esses alunos em seu Nível B, correspondendo ao nosso Nível 2. Ben-Zvi (2004) observou que os alunos em seu Estágio 3 (de sete estágios) fizeram tentativas informais para explicar a variabilidade. Isso corresponde à observação de Torok e Watson de que os alunos em seu Nível B reconhecem a variação fornecendo uma gama de respostas em vez de valores específicos.

Os alunos do Nível 3 do nosso LP têm alguma facilidade com a aplicação do raciocínio proporcional a problemas de variação, mas podem produzir respostas com muita ou pouca variação. Esta observação é apoiada pelas descobertas de Torok e Watson (2000) e Watson et al. (2003). Watson et al. também observou que os alunos do Nível 3 podem calcular a média, mas não apreciam a importância da variação. Isso é consistente com o Estágio 5 de Ben-Zvi (2004), no qual os alunos podem calcular medidas de centro e dispersão, mas não têm uma compreensão conceitual dessas medidas. Também é consistente com a descoberta de delMas e Liu (2005) de que os alunos neste nível têm uma compreensão superficial e fragmentada do desvio padrão.

Watson et al. (2003) descobriram que os alunos do Nível 2 são propensos a fazer interpretações errôneas de gráficos, os alunos do Nível 3 podem fornecer uma análise parcial de um gráfico enquanto perdem as tendências gerais, e os alunos do Nível 4 são propensos a fazer análises estatisticamente apropriadas de gráficos. Este último achado é consistente com o Estágio 7 final de Ben-Zvi (2004), no qual os alunos geram exibições gráficas de dados e as usam para comparar distribuições.

Reading e Shaughnessy (2000, 2004) distinguiram entre alunos que descrevem uma distribuição em termos de desvios de um valor âncora que não é um valor central e alunos que descrevem uma distribuição em termos de desvios de um valor central. Reading (2004) identificou o primeiro grupo de alunos com o Nível 3 de Watson et al. (2003) e o segundo grupo com o Nível 4, como fizemos em nosso LP.

Finalmente, nosso Nível 5 é adaptado de Peters (2011), consulte a Tabela 1. Um entendimento neste nível constitui um entendimento de múltiplos aspectos da variabilidade e múltiplos contextos nos quais a variabilidade ocorre. Também inclui uma compreensão das interconexões entre variabilidade e conceitos relacionados (Peters, 2011). Representa o nível de compreensão da variabilidade que se esperaria de estudantes universitários avançados e professores em serviço.


Discussão e conclusões

Começamos este artigo destacando o fato de que as interações competitivas entre gangues rivais costumam parecer desequilibradas. Algumas gangues são exportadoras líquidas de violência (ou seja, mais frequentemente agressores em homicídios), enquanto outras são importadoras líquidas (ou seja, mais frequentemente alvos em homicídios). É razoável supor que tais desequilíbrios na violência refletem desequilíbrios na capacidade competitiva, uma vez que a violência parece central para a forma como as gangues “lutam por posições de domínio” (Papachristos 2009, p. 76). Exatamente como essas dinâmicas se desdobram permanece uma questão em aberto, entretanto, uma vez que não temos expectativas formais sobre como o domínio competitivo, o tamanho das gangues e a direção da violência devem estar relacionados.

Para corrigir essa situação, recorremos a modelos matemáticos desenvolvidos pela primeira vez para lidar com problemas análogos observados na ecologia de plantas (Tilman, 1994). A principal vantagem do modelo de Tilman é que ele nos permite fazer suposições estritas sobre o domínio competitivo e seguir essas suposições até suas expectativas empíricas. A suposição principal é que um competidor superior sempre pode deslocar um competidor inferior onde quer que ele seja encontrado e sempre manter um local contra qualquer incursão de um competidor inferior. Sob tais condições, competidores inferiores podem persistir se eles puderem explorar o espaço rapidamente assim que for desocupado por competidores superiores e / ou se eles puderem manter o espaço vazio por mais tempo antes de serem deslocados. Em essência, concorrentes inferiores são capazes de sobreviver nos “interstícios” entre concorrentes superiores. Mapeamos o modelo de Tilman no caso de gangues de rua, com foco nos padrões de atividade. Muitas de nossas observações gerais correspondem exatamente às de Tilman. Nossa contribuição única foi estender o modelo para produzir expectativas sobre as relações entre capacidade competitiva, tamanho da gangue e direcionalidade da violência.

O modelo sugere que o tamanho da gangue, quando medido como a proporção do espaço usado por uma gangue, não é um proxy simples para a classificação competitiva de uma gangue (ver especialmente as Figs. 2, 3). O tamanho da gangue e a posição competitiva só são positivamente correlacionados se todas as gangues em uma hierarquia competitiva adotarem uma estratégia pura de coexistência. Ou seja, todas as gangues devem qualquer têm taxas de cessação de atividade idênticas e alavancam taxas de spread de atividades variáveis, ou têm taxas de propagação de atividades idênticas e alavancam taxas variáveis ​​de cessação de atividades. Se gangues individuais adotam estratégias mistas, o tamanho da gangue não consegue acompanhar a classificação competitiva. As maiores gangues podem ser competitivamente inferiores e as menores superiores em termos de capacidade de deslocamento absoluto. Os modelos também sugerem que a direcionalidade da violência, medida pelo grau de homicídio interno e externo por gangue, também não é um proxy simples para a classificação competitiva (ver especialmente a Fig. 5). As gangues grandes costumam sofrer mais violência geral (grau cumulativo dentro e fora) do que as gangues pequenas. No entanto, a variação na classificação competitiva (e o ruído aleatório nas taxas de interrupção e disseminação de atividades) podem fazer com que uma gangue passe de importadora líquida a exportadora líquida de violência.

Examinamos as implicações dos modelos usando dados de homicídio da Área de Polícia Comunitária de Hollenbeck da LAPD. O tamanho do território não está fortemente correlacionado com a direcionalidade da violência entre rivais, medida por grau de entrada e saída na rede de homicídios. O tamanho do território é apenas marginalmente melhor para prever o volume total da violência. O modelo apresentado aqui sugere que não devemos nos surpreender com esse resultado, pois a capacidade competitiva, o tamanho da gangue e a direcionalidade da violência não precisam estar fortemente conectados, mesmo onde existe domínio competitivo absoluto. Os graus de entrada e saída observados para a rede de homicídios de Hollenbeck talvez sejam mais consistentes com gangues alavancando taxas de disseminação de atividades mais rápidas para contornar assimetrias competitivas do que um modelo alternativo de taxas de cessação de atividades mais lentas. No entanto, não realizamos uma avaliação rigorosa do modelo, pois ainda existem muitas incógnitas que merecem uma discussão teórica mais aprofundada (veja abaixo). No entanto, é razoável supor que gangues como El Sereno, e talvez Clover, sejam importadores líquidos de violência como resultado de seu tamanho grande e posição relativamente alta em capacidade competitiva. Por outro lado, gangues como KAM e Lincoln Heights podem ser exportadores líquidos de violência por causa de seu tamanho intermediário e classificação competitiva relativamente baixa. No entanto, existem gangues que não se alinham perfeitamente com as expectativas do modelo. Esses valores discrepantes observaram em graus que são muito maiores do que o esperado para o pequeno tamanho do território (por exemplo, Primera Flats, Tiny Boys), ou muito menores do que o esperado para o seu grande tamanho do território (por exemplo, Metro 13). Supondo que as contagens de graus de entrada e saída sejam precisas, o alinhamento com as expectativas do modelo exigiria que os tamanhos dos territórios fossem ajustados para cima ou para baixo.

Limitações

Este estudo tem várias limitações importantes. Em primeiro lugar, o uso de dados de homicídio pode não ser a melhor métrica para avaliar o domínio de gangues, uma vez que esses atos de violência são provavelmente raros quando comparados a outras opções menos graves que podem realizar praticamente a mesma coisa (por exemplo, agressão agravada ou simples). No entanto, como a maioria dos atos de violência relacionada a gangues envolvem armas de fogo (Huebner et al. 2016 Maxson et al. 1985 Maxson e Klein 1990 Pizarro 2017 Rosenfeld et al. 1999 Valasik 2014), a única diferença entre um homicídio relacionado a gangues e uma gangue -assalto agravado relacionado pode ser aleatório. Assim, gangues mais dominantes podem tentar utilizar atos de violência menos graves; no entanto, o resultado ainda pode ser um homicídio. Além disso, a pesquisa mostrou que a investigação de homicídios por policiais é provavelmente a mais robusta, visto que quase sempre há uma vítima, com uma unidade policial especializada que dedica substancialmente mais tempo investigativo e esforço para sua resolução (Petersen 2017 Pizarro et al. 2018 Regoeczi 2018). Neste estudo, espera-se que a investigação minuciosa de homicídios relacionados a gangues forneça um quadro muito mais completo do evento violento, incluindo dados confiáveis ​​sobre as afiliações de gangues do alvo e do agressor, duas informações cruciais necessárias para as análises atuais. Dessa forma, o uso de homicídios relacionados a gangues como única medida de violência provavelmente é uma medida conservadora.

É prematuro concluir que o tamanho do território não é um indicador útil de classificação competitiva. Parte do problema pode estar na maneira como os territórios das gangues são reconhecidos e medidos em cenários do mundo real. Gravar territórios de gangues como polígonos convexos e limitados pode ser pragmático. No entanto, há boas razões para questionar se esta é uma representação realista da distribuição da atividade das gangues, controle da área da gangue ou posição competitiva da gangue. Há muito se reconhece que as gangues podem reivindicar uma grande faixa de terra, mas a maioria dos encontros ocorre em apenas alguns locais, denominados "espaços definidos" por Tita et al. (2005). Na verdade, Valasik (2018) descobriu que áreas com altas concentrações de residências de membros de gangues e locais de espaços de conjuntos de gangues correm o maior risco de sofrer um homicídio relacionado a gangues. Pode ser mais apropriado pensar nos territórios das gangues como uma rede de nós de atividades localizados e corredores ou caminhos entre eles. Isso seria um análogo em nível de grupo da teoria do padrão de crime (Brantingham e Brantingham 1993). Alguns nós e corredores podem ser comuns à gangue como um todo (ou seja, espaços definidos), enquanto outros podem estar ligados às atividades de membros de gangue individuais (por exemplo, residências de membros de gangue). Os territórios das gangues parecem se sobrepor substancialmente quando desenhados como polígonos convexos. Por exemplo, em toda a cidade de Los Angeles, aproximadamente 40% de todos os territórios de gangues documentados se sobrepõem de acordo com os mapas de territórios de gangues de 2010. No entanto, se os territórios são realmente uma “malha” de nós móveis e corredores entre eles, então a distribuição de tamanho de equilíbrio real das gangues pode ser bem diferente (e menor) do que aquela medida usando mapas de território.

Essa preocupação com a definição de territórios levanta uma questão relacionada sobre a modelagem de padrões espaciais e temporais de comportamento de gangues. Os modelos apresentados acima são espacialmente implícitos. Eles lidam apenas com a proporção do espaço ocupado por uma gangue, não com o arranjo espacial real dessas gangues. Os modelos implicam, entretanto, que os arranjos espaciais das gangues estão sujeitos a mudanças constantes. Embora as gangues ocupem uma proporção estável da paisagem em equilíbrio, há uma rotação regular em que as gangues ocupam quais locais. Essa mudança não é consistente com a visão “turfa como polígono” da territorialidade das gangues. Pode ser mais consistente com a ideia de que os territórios das gangues são uma malha móvel de nós e corredores. Os modelos espacialmente implícitos também não levam em consideração nenhuma restrição de mobilidade (Hubbell 2005 Turchin 1998). Até onde as pessoas se movem desempenha um papel importante na geração de padrões de crime (Brantingham e Tita 2008) e presumivelmente desempenha um papel importante na formação e manutenção de territórios de gangues (Brantingham et al. 2012 Hegemann et al. 2011 Valasik e Tita 2018) . Incluir a mobilidade no modelo atual exigiria uma abordagem espacialmente explícita. Esses modelos são muito mais desafiadores do ponto de vista matemático, mas frequentemente levam a novos insights bastante diferentes dos modelos espacialmente implícitos (Kareiva e Wennergren 1995, Tilman et al. 1994). Portanto, é prematuro afirmar que taxas de disseminação de atividades mais rápidas serão uma propriedade decisiva em sistemas espacialmente explícitos de gangues.

Os modelos desenvolvidos aqui oferecem apenas uma visão limitada da dinâmica competitiva. Reconhecemos que é extremo supor que as gangues formem uma hierarquia competitiva estrita. Essa suposição é teoricamente valiosa como forma de contrafactual. É muito mais provável, entretanto, que a habilidade competitiva seja dependente do contexto (Hubbell 2005). Quem tem a vantagem em qualquer interação diádica pode depender tanto de onde a interação ocorre, ou de quem está presente, quanto de alguma habilidade competitiva global da gangue. É necessária uma avaliação mais detalhada dos custos e benefícios que surgem nas interações competitivas entre contextos. Por exemplo, talvez seja irreal presumir que gangues inferiores continuarão a atacar gangues superiores se tais ataques nunca resultarem em deslocamentos bem-sucedidos. Os contextos nos quais os ataques são bem-sucedidos e malsucedidos podem ter grande importância para a compreensão da dinâmica competitiva.

Uma preocupação relacionada é se é razoável modelar uma comunidade de gangues como uma única hierarquia competitiva. As interações competitivas podem ser restritas a grupos menores de gangues que existem em estreita proximidade espacial entre si. Uma comunidade mais ampla de gangues pode, na verdade, ser mais bem modelada como um sistema multiescala composto de várias hierarquias competitivas que às vezes interagem. Essas preocupações novamente nos apontam na direção de modelos espacialmente explícitos, nos quais a classificação competitiva das gangues pode mudar no cenário. Também sugere um papel para a teoria dos jogos na modelagem da competição como interações estratégicas que podem incluir comportamento diferente de atuar como um competidor superior (ou inferior). Especificamente, acreditamos que será importante relaxar a suposição de que a propagação da atividade e as taxas de cessação para cada gangue permanecem inalteradas no tempo. Essas características, se importantes, provavelmente estariam sob forte seleção por meio de algum mecanismo de aprendizagem. As gangues inferiores podem ficar em desvantagem ainda maior se as gangues superiores procurarem bloquear as oportunidades espaciais em resposta às interações competitivas, evoluindo sua disseminação de atividades e taxas de cessação. Essas possibilidades exigirão um exame mais aprofundado.


Assista o vídeo: Introdução à Teoria dos Grafos Aula 17 Árvores (Outubro 2021).