Meu nome é Pedro Lourenço Mendes Júnior, formato em Matemática pela Universidade Federal de Santa Catarina e em transição para a área de Ciência de Dados.
📚 Atualmente trabalho como Analista de Dados e me mantenho atualizado sobre Python, Estatística, Machine Learning, Análise de Dados, Visualização de Dados, SQL e entre outros tópicos.
🎯 Objetivo: Ingressar na carreira de Cientista de Dados e impactar nas tomadas de decisão da empresa através dos dados.
🎲 Me interesso também por esportes em geral e sobre boardgames. Sou um colecionador e amante dos jogos de tabuleiro modernos.
Descrição: Os objetivos principais do projeto são: quantificar os dados da amostra e encontrar, caso exista, um perfil demográfico dos indivíduos com sintomas depressivos e identificar possíveis relações entre hábitos sociais e alimentares com reflexo na presença de sintomas depressivos. Para isso, foi realizada uma análise exploratória dos dados e testes de hipóteses com os insights gerados da análise.
Descrição: Nesse projeto, utilizamos webscrapping para fazer um raspagem dos dados de imóveis a venda num portal imobiliário para alimentar algoritmos de Machine Learning, a fim de prever o preço de imóveis. Posteriormente, foi feito um web app para que o usuário coloque as informações de um imóvel que queira estimar o valor de venda. Durante o projeto, também foi feito um painel para visualizar os dados com possibilidades de filtros pelo usuário.
Descrição: Realizamos a elaboração de um dashboard de vendas com os principais KPI's, visualização de dados, filtragem e segmentação. É possível conferir os principais números como: faturamento, ticket médio, número de vendas segmentando por grupo de produtos, produtos, vendedores, gerentes, ano e etc. Dessa forma, a toma de decisão de um time comercial fica muito mais assertiva, respaldada por resultados reais de fácil interpretação e acesso.
Descrição: Nesse projeto, utilizamos algumas técnicas de machine learning e análise estatística para elaborar um projedo de data science. Durante o trabalho, pudemos desenvolver uma análise gráfica dos dados através das bibliotecas mais utilizadas como matplotlib, seaborn e entre outros. Na parte final do projeto, utilizamos validação cruzada para definir alguns parâmetros para os algoritmos de Decision Tree e Random Forest Classifier. Por fim, usamos algumas métricas para comparar a performance dos modelos.
Descrição: O projeto de Clusterização desta-se por ser meu primeiro primeiro com dados não supervisionados. Exploramos um dataset de clientes de um mercado com multi canais de venda fazendo uma análise exploratória robusta que nos trouxe alguns insights do negócio. Por fim, utilizamos o algoritmo de machine learning K-Means para segmentar os clientes em clusters e propor algumas sugestões de campanhas de ofertas personalidades para diferentes perfis de clientes.
Descrição: Utilizei técnicas de visualição de dados, estatística descritiva, geolocalização. Esse foi o meu primeiro projeto de Análise de Dados desenvolvido. Apesar de simples, foi de grande relevancia para o meu desenvolvimento nas habilidades técnicas utilizadas no projeto. Tecnologias utilizadas: Python, Matplotlib, Plotly, Seaborn
Descrição: Um painel com os dados obtidos no Our World in Data sobre as aplicações das vacinas da COVID-19 no mundo. No projeto, podemos ver a quantidade ministrada em 1a dose, vacinação completa e dose de reforço por continente ou país. Além disso, uma relação entre o PIB per capita e a aplicação de vacinas.
-
1. Análise de Dados: Desenvolvendo Insights com SQL + Python:
-
2. Pandas_dq será sua nova ferramenta de limpeza e pré-processamento de dados.:
-
3. Entendendo as métricas ROC Curve e AUC ROC para modelos de classificação em ML.:
-
4. Humanize: Um overview de como ‘humanizar’ seus dados e deixa-los mais legíveis com Python.:

