Treinamento Análise de Dados com R
O treinamento Análise de Dados com R foi elaborado para apresentar, conceituar e colocar na pratica a linguagem R, com sua aplicabilidade para análise de grandes conjuntos de dados em diversas áreas de negócio.
O R é uma tecnologia de código aberto e tem como sua principal característica atender necessidades da analise estatística e está incorporada ou integrada a diversos outros software de analise e processamento de dados como Apache Spark, Power BI, Tableau, Pentaho, Apache Hop, Apache Nifi, entre outros, assim como conectividade aos principais bancos de dados do mercado. Cientista de dados e Analistas de dados sãos profissional atuantes nesta ferramenta, e podem aplicar seus conceitos para especializações como: People Analytics, Financial Analytics, Marketing Analytics, etc.
Calendário de turmas.
Somente no modelo corporativo no momento.
Dificuldade: Intermediário.
Aplicabilidade.
Este treinamento foi desenvolvido usando a linguagem R 4.3.2 e foi modificado pela última vez em 12 de Novembro de 2023.
Conteúdo Programático
Conceitual.
- Introdução a Data Science.
- O profissional Cientista de Dados.
- People Analytics, Financial Analytics e outras especializações.
- O Software R.
- Software Livre x Open Source.
- Licenciamento do R.
- Histórico do R.
- R Foundation.
- Empresas usando R no Mundo.
- Empresas usando R no Brasil.
- Comunidade R.
- Versões do R.
- Casos de Uso com R.
Instalando o R.
- Instalando o Software R.
- Instalação do RStudio IDE.
- Instalação do software adicionais.
Fundamentos da Linguagem R.
- A linguagem R.
- Operadores.
- Tipos de Dados.
- Variáveis.
- Vetores.
- Matrizes.
- Listas
- Strings.
- Funções
- Expressões Regulares
- Pacotes.
- Principais Bibliotecas de R para análise de dados.
- NSE (Non-standard evaluation)
- Pipe.
RStudio IDE
- Interfaces.
- Atalhos.
- Projetos.
- Addins.
- Cheatsheets.
- Snippets.
Estrutura de Dados em R.
- Data Frames.
- Usando R para Importação.
- Lendo dados de arquivos (CSV).
- Limpeza de dados.
- Preparação de dados.
- Construindo Datasets.
- Outras fontes de dados (Excel, bases de dados, web).
- Manipulação de Banco de Dados.
Visualização de Dados em R.
- Graphics Package.
- plot.
- barplot.
- hist.
- boxplot
- scatter plot.
- Heat Map.
- ggplot2 package (qplot e ggplot).
Formatação de Dados.
- Formatando e Limpando os Dados com dplyr.
- Formatando e Limpando os Dados com tidyr.
Métodos estatísticos em R.
- Funções Estatísticas.
- Dealing.
- Probability distributions.
- Distributions (Binomial, Poisson, Normal).
- Grouping e loops.
- Conditional execution.
- Escrevendo suas funções.
Análise Preditiva e Machine Learning com R.
- Introdução à Machine Learning.
- Linear Regressions.
- Recommendations.
- Clusterin.
- KMeans.
- Classification.
- Naive Bayes.
- Decision Trees.
- Correlação entre causa e efeito.
Gerais.
- Big Data Ecosystem.
- Importação de Dados e Web Scraping.
- Text Mining.
- Subsetting, Séries Temporais e Análise Reproduzível.
- Documentação com R Markdown.
- Programação funcional com R.
Overview People Analytics - R para Recursos Humanos.
- Fundamentos de HR analytics.
- Interpretação de dados.
- Storytelling.
- Aquisição de dados.
- Data-Management Tools.
Carga Horária.
- 32 Horas.
Modalidade do Treinamento.
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos.
- Conhecimento Básico de Estatística é recomendável.
- Conhecimento Básico de programação é recomendável.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.
Requisitos Recomendados de Hardware.
- Memória RAM: 8GB.
- Espaço em Disco: 30 GB
- Processadores: 64 bits (chipsets de x64).
- CPU: 4 CPUs/núcleos.
- Sistemas Operacionais: GNU/Linux, Windows.
- Virtualbox.
Material.
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares R e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia.
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos R e cursos R. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Inscrições, Informações e Valores
Diferenciais da Ambiente Livre.
A Ambiente Livre tem 22 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
5.007 profissionais capacitados em 399 turmas ministradas.
Atuação global, 845 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.980 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Instrutor.
Marcio Junior Vieira
- 27 anos de experiência em TI, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
- CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
- Atuou como Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo e do MBA Artificial Intelligence e Machine Learning da FIAP.
- Atuou como Pesquisador pelo UFG/CIAP (Centro de Colaboração Interinstitucional de Inteligência Artificial Aplicada às Políticas Públicas) e no grupo Latitude (Laboratório de Tecnologias da Tomada de Decisão) da UNB.
- Trabalhando com Free Software e Open Source desde 2000 com serviços de consultoria e treinamento.
- Graduado em Tecnologia em Informática (2004) e pós-graduado em Software Livre (2005) ambos pela UFPR.
- Palestrante FLOSS em: The Developers Conference (TDC), FISL, Latinoware, Campus Party, Pentaho Day, Ticnova, PGConf Brasil e FTSL.
- Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas edições de 2013 e 2014.
- Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
- Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Serpro, Natura, MP, Netshoes, Embraer entre outras.
- Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e Kafka.
- Contribuidor de projetos Open Source ou Free Software internacionais, tais como Pentaho, LimeSurvey, SuiteCRM, Camunda, Operaton e Apache Hop.
- Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable, Camunda e Operaton.
- Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).