Maptile Um programa stata que facilita o mapeamento. Maptile fornece um método simples para mapear uma variável no Stata. Ele divide as áreas no mapa em grupos e as matiza de acordo com o valor da variável que está sendo plotada. O mapa em si é desenhado usando modelos geográficos, que podem ser baixados aqui. Esses modelos são fáceis de criar e compartilhar. Exemplo Este mapa mostra as taxas de mortalidade ajustadas por idade de 2017 para os americanos brancos. O mapa foi criado executando: maptile mortwhite, geo (state) Instalação Abra Stata e instale maptile executando os comandos: Depois de instalar maptile, você pode ler a documentação executando a ajuda maptile. A seção de exemplos do arquivo de ajuda contém um clique-clicável de vários recursos maptiles. Antes de fazer um mapa, você precisará instalar um modelo de geografia. Há muitos livremente disponíveis aqui para você instalar e usar. Introdução Slide Deck Esta plataforma de slide fornece uma introdução visual ao maptile. Ele explica: como maptile gera as caixas como maptile colore os bins métodos para comparar subpopulations como criar um novo modelo de geografia Você também pode baixar os arquivos de origem. Que incluem o código de Stata para gerar cada figura mostrada no deck de slides. Descrição Técnica maptile gera mapas de choreplétes, onde cada área é sombreada de acordo com o valor da variável que está sendo plotada. Por padrão, maptile divide as unidades geográficas em compartimentos de tamanho igual (correspondendo a quantiles da variável plotada), então colore as caixas em intensidade crescente. Para gerar qualquer mapa particular, maptile usa uma geografia, que é um modelo para esse mapa. Estes precisam ser baixados e instalados. Se atualmente não houver geografia para a região que você deseja mapear, você pode criar uma nova. Maptile requer spmap para ser instalado, e é em grande parte uma interface conveniente para usar spmap. Como diz seu arquivo de ajuda, o spmap dá ao usuário controle total sobre a formatação de quase todos os elementos do mapa, permitindo assim a produção de mapas altamente personalizados. Ao usar maptile, a maioria dessas personalizações são armazenadas no modelo de geografia. Como resultado, a sintaxe para fazer mapas altamente personalizados usando maptile pode ser muito simples. Além disso, os modelos de geografia podem ser facilmente compartilhados e usados por outros. Agradecimentos maptile foi construído sobre os ombros de gigantes. Os mapas são gerados usando spmap. Escrito por Maurizio Pisati. Os shapefiles do modelo de geografia foram feitos usando shp2dta. Escrito por Kevin Crow, bem como mergepoly. Escrito por Robert Picard. Bem-vindo ao Instituto de Pesquisa Digital e Educação Stata Class Notes Contando de n para N Introdução Stata tem duas variáveis internas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 na segunda, 3 na terceira, e assim por diante. N é a notação Stata para o número total de observações. Vejamos como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação executado de 1 a 7 e nt é o número total de observações, que é 7. Contando com usando n e N em conjunto com o comando by podem produzir alguns resultados muito úteis. Naturalmente, para usar o comando by, primeiro devemos classificar nossos dados na variável por. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo use o seguinte: Para listar a pontuação mais alta para cada grupo use o seguinte: Outra utilização de n Permite usar n para descobrir se há números de identificação duplicados nos seguintes dados: Como se verifica, As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicatas Agora vamos usar N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos todas as variáveis na instrução by e definimos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando assim as observações duplicadas. Se você tem um monte de variáveis no conjunto de dados, pode demorar muito tempo para digitá-los todos fora duas vezes. Podemos fazer uso do caractere curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar sort e by em uma única declaração. Abaixo está uma versão simplificada do código que irá produzir os mesmos resultados exatos como acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa Digital e Educação Stata FAQ Como posso fazer um mapa de calor de matriz de correlação Esta página mostrará vários métodos para fazer um mapa de calor de matriz de correlação. A primeira coisa que precisamos é uma matriz de correlação que vamos criar usando o comando corr2data, definindo uma matriz de correlação (c), desvios padrão (s) e médias (m). Definimos o tamanho da amostra como 400 usando a opção n (). A inspeção da matriz de correlação mostra que há três conjuntos de variáveis fortemente intercorrelacionadas (1, 2 3), (4, 5 6) e (7, 8 9). As correlações entre as variáveis em conjuntos diferentes variam de 0,01 a 0,40. Estas são a correlação que queremos visualizar. O próximo passo é levar os elementos da matriz de correlação e transformá-los em valores de dados em nosso conjunto de dados. Neste processo vamos criar três novas variáveis rho1 o índice da linha, rho2 o índice da coluna e rho3 o coeficiente de correlação propriamente dito. O último comando, svmat. Salva a matriz rho para o nosso conjunto de dados. Agora podemos criar nossos mapas de calor de matriz de correlação começando com um que usa o comando de gráfico de contorno. A opção ccuts () define que os valores de corte para as correlações, enquanto o ccolors define as cores a serem utilizadas para cada um dos cortes. Um outro item de nota, a opção yscale (reversa) inverte a escala no eixo y de modo que a diagonal principal do gráfico vá do canto superior esquerdo para o canto inferior direito. Podemos certamente ver a estrutura das correlações no entanto, existem outras maneiras de produzir um mapa de calor. Desta vez, usaremos um comando de diagrama de dispersão twoway comum. Este comando parece muito mais complexo, mas realmente não é. É apenas um scatterplot repetido várias vezes para diferentes faixas do coeficiente de correlação. Novamente, usamos o yscale (reverso) como antes. Usando a mesma abordagem, podemos produzir o mapa de calor usando uma escala de cinza. Esses examles mostram os princípios básicos, mas não lidar com a complexidade das correlações negativas. Podemos sempre tomar os valores absolutos da correlação quando se lê na matriz de correlação. No entanto, é provavelmente melhor estender a escala do mapa de calor para os valores negativos das correlações. Aqui está um exemplo usando twoway scatter. Usando valores RGB as cores variam de rosa para vermelho para as correlações positivas e de azul claro para azul escuro para as correlações negativas. A escolha do esquema de cores é muito pessoal. Suas escolhas podem ser muito diferentes das minhas. Se você gosta de padrão Statas escolha de cores para o contorno enredo, aqui é o que parece o enredo. Uma nota final, se você tiver mais variáveis do que as nove usadas neste exemplo, você pode querer fazer o msize () menor. Em ordem de maior para menor os tamanhos são: ehuge, vhuge, enorme, vlarge, grande, medlarge, médio, medsmall, pequeno, vsmall, minúsculo e vtiny. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia.
No comments:
Post a Comment