- 2. Revisão, ajustes e catalogação de dados para o ODR
- Dados de Pós-Graduação GEOCAPES - TAB_0011, TAB_0012, TAB_0013 e TAB_0014
Dados de Pós-Graduação GEOCAPES - TAB_0011, TAB_0012, TAB_0013 e TAB_0014
ao longo dos anos
1. Antecedentes
De acordo com a Lei n° 11.502/2007, a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) é responsável por subsidiar o Ministério da Educação na formulação de políticas e suporte, não só à pós graduação strictu sensu no Sistema Nacional de Pós-Graduação, mas também na formação de professores da educação básica. O suporte no âmbito da pós-graduação envolve a coordenação e avaliação de cursos desse nível, além do estímulo mediante bolsas de estudos, auxílios e a formação de recursos humanos qualificados. No âmbito da educação básica, a Capes tem como finalidade induzir e fomentar a formação inicial e continuada de profissionais de magistério, inclusive em regime de colaboração com os governos municipais e estaduais mediante convênios com instituições de ensino superior, públicas ou privadas.
Desde 2004, as informações sobre os alunos de pós-graduação, os bolsistas atendidos e os dados relativos aos investimentos realizados nos estados da federação e suas instituições de ensino superior, passaram a ser tratadas de forma sistematizadas. Em 2009 a instituição laçou a plataforma GeoCapes, um sistema que divulga informações georreferenciadas sobre docentes, discentes, bolsas (no Brasil e no Exterior) e investimentos. Inicialmente, a agregação geográfica era feita por unidade de federação. Atualmente, entretanto, o sistema disponibiliza informações a nível municipal, com exceção dos dados de investimentos em bolsas.
2. Metodologia
Os dados do GeoCapes são registros administrativos em sistemas informatizados, tais como o cadastro de docentes e registro de acesso a periódicos
3. Obtenção e estruturação da base
A obtenção dos indicadores GEOCAPES é bastante simples, e foi executada conforme ilustra a figura a seguir. O sistema já disponibiliza um botão para download de toda a série histórica do indicador selecionado, discriminado por programa de pós-graduação, área de conhecimento, área de avaliação, instituição de ensino e ente federado (estado ou município).
Foram obtidos dados com referência municipal de quatro indicadores: Concessão de bolsas da pós-graduação da Capes no Brasil (armazenado no arquivo "Concessão de bolsas da pós.xlsx"), distribuição de discentes de pós-graduação no Brasil (arquivo "Distribuição de discentes da pós.xlsx"), distribuição de docentes ("Distribuição de docentes.xlsx") e distribuição de programas da pós-graduação no Brasil ("Distribuição de programas de pós"). Os respectivos arquivos foram convertidos para o formato .csv.
Posteriormente, os dados foram lidos em software R para inserção dos códigos dos municípios e para padronização dos nomes das colunas. O script para execução desses passos está armazenada no arquivo Script GEOCAPES.R disponível via Git. A rotina em questão resultou em quatro tabelas consolidadas:
- TAB_0011: base de discentes;
- TAB_0012: base de bolsas;
- TAB_0013: base de docentes;
- TAB_0014: base de programas.
3.1 Ressalvas
As tabelas obtidas possuem um campo em comum informando o código do programa. Assim, checagens foram realizadas para verificar a se as informações de áreas de conhecimento, áreas de avaliação, grandes áreas e descrições dos programas são compatíveis entre as bases para o mesmo mesmo código de programa.
Primeiramente, foi possível notar que para alguns programas há mudanças ao longo dos anos nas áreas de conhecimento e avaliação e na grande área. Além disso, foi possível confirmar que as informações de áreas de conhecimento, de avaliação, grandes áreas e descrições de programas são consistentes nas bases de docentes, discentes e de programas para cada ano e código de programa. Entretanto, há divergências consideráveis quando estas informações são comparadas com as classificações constantes na base de bolsas. Vale salientar também que há ocorrências de códigos de programa que não estão presentes em todas as bases.
Outra consideração importante diz respeito ao esforço de acrescentar o código IBGE dos municípios na base. O procedimento envolveu, em cada base GeoCapes, a concatenação do nome com a sigla da UF, remoção de caracteres especiais e transformação para maiúsculas. Com isso, foi possível relacionar tais nomes com os existentes na Divisão Territorial do Brasil (TAB_0005) e assim obter o código. No entanto, em alguns casos havia divergência do nome do município com a UF (Exemplos: São Paulo - MA, Rio de Janeiro- PR, etc.), impossibilitando a obtenção automática dos códigos. Esses casos, que ocorrem em 22 linhas da base de docentes e de discentes, foram excluídos da base.
4. Variáveis
As variáveis presentes na TAB_0011 são descritas a seguir:
- codigo_mun7: Código do município a 7 dígitos
- ano: Ano
- ies: Nome da Instituição de Ensino Superior
- status_juridico: Status Jurídico da Instituição de Ensino Superior (Federal, Estadual, Municipal ou Privada)
- codigo_programa: Código do programa
- programa: Nome do programa
- area_avaliacao: Área de avaliação
- area_conhecimento: Área de conhecimento
- grande_area: Grande área
- doutorado_matriculado: Número de matriculados em curso de doutorado
- doutorado_titulado: Número de titulados em curso de doutorado
- mestrado_matriculado: Número de matriculados em curso de mestrado
- mestrado_titulado: Número de titulados em curso de mestrado
- mestrado_profissional_matriculado: Número de matriculados em curso de mestrado profissional
- mestrado_profissional_titulado: Número de titulados em curso de mestrado profissional
- total: Total de discentes de pós-graduação
Na base TAB_0012, constam as seguintes variáveis:
- codigo_mun7: Código do município a 7 dígitos
- ano: Ano
- codigo_programa: Código do programa
- programa_fomento:
- ies: Nome da Instituição de Ensino Superior
- status_juridico: Status Jurídico da Instituição de Ensino Superior (Federal, Estadual, Municipal ou Privada)
- programa: Nome do programa
- area_avaliacao: Área de avaliação
- area_conhecimento: Área de conhecimento
- grande_area: Grande área
- coordenador_geral_isf: Número de bolsas de coordenadores gerais do IsF
- coordenador_pedagogico_isf: Número de bolsas de coordenadores pedagógicos do IsF
- coordenador_de_centro_isf: Número de bolsas de coordenadores de centro do IsF
- doutorado: Número de bolsas de doutorado
- iniciacao_cientifica: Número de bolsas de iniciação científica
- mestrado: Número de bolsas de mestrado
- mestrado_profissional: Número de bolsas de mestrado profissional
- prof_visitante_nacional_senior: Número de bolsas de professores visitantes nacionais (senior)
- professor_isf: Número de bolsas de professores IsF
- pos_doc: Número de bolsas de pós doutorado
- supervisao: Número de bolsas de supervisão
- total: Total de bolsas concedidas
Já na base TAB_0013, estão presentes as seguintes variáveis:
- codigo_mun7: Código do município a 7 dígitos
- ano: Ano
- ies: Nome da Instituição de Ensino Superior
- status_juridico: Status Jurídico da Instituição de Ensino Superior (Federal, Estadual, Municipal ou Privada)
- codigo_programa: Código do programa
- programa: Nome do programa
- area_avaliacao: Área de avaliação
- area_conhecimento: Área de conhecimento
- grande_area: Grande área
- colaborador: Número de docentes colaboradores
- permanente: Número de docentes permanentes
- visitante: Número de docentes visitantes
- total: Total de docentes
E finalmente, a base TAB_0014 disponibiliza as seguintes variáveis
- codigo_mun7: Código do município a 7 dígitos
- ano: Ano
- ies: Nome da Instituição de Ensino Superior
- status_juridico: Status Jurídico da Instituição de Ensino Superior (Federal, Estadual, Municipal ou Privada)
- codigo_programa: Código do programa
- programa: Nome do programa
- area_avaliacao: Área de avaliação
- descricao_area: Descrição da área
- grande_area: Grande área
- descricao_programa: Descrição do programa
- conceito: Conceito CAPES
5. Informações adicionais
Os seguintes dados servem para monitoramento e documentação da base.
- Versão do fluxo de dados: versão 0;
- Data da última atualização: 17 de março de 2015;
- Agenda de divulgação (provável):
6. Referências