Autor: Airton Lira Junior

Colunistas

Ciclos de Similaridade Web: Como Identificar Padrões e Rupturas na Era dos Dados

Colunistas 16/06/2025Por Airton Lira JuniorAtualizado em: 16/06/20256 minutos de leitura

A Nova Fronteira da Análise Digital Imagine um mundo onde cada website que surge na internet é automaticamente comparado com milhões de outros sites, identificando não apenas suas semelhanças visuais, mas também seus padrões de comportamento, estrutura de conteúdo e performance. Essa realidade já existe, e está transformando como entendemos os ciclos de inovação digital. O Que São Ciclos de Similaridade Web? Os ciclos de similaridade web representam períodos onde múltiplos websites seguem padrões similares de design, funcionalidade ou estratégia de conteúdo. Tradicionalmente, identificar esses padrões exigia análise manual extensiva e muito tempo. Hoje, através da combinação de tecnologias como…

Leia mais

Dicas

Séries temporais e seus componentes, aplicando ARIMA para forecast em dados do COVID-19.

Dicas 24/05/2025Por Airton Lira Junior13 minutos de leitura

Ao longo dos meus estudos de analise de dados, previsões, Machine Learning, Deep Learning e estatísticas eu percebi uma complexidade maior no entendimento sobre séries temporais, seja pela grande necessidade de entender uma série de outros conceitos que não estão relacionados aos modelos de previsão numérica e classificação, seja pela falta de material em português com uma abordagem bem teórica sobre séries temporais e seus modelos de forecasting. Portanto neste artigo eu busco abordar uma sequencia de conceitos básicos sobre séries temporais que ajudam não só a entender melhor os gráficos do seus dados como também a entender como aplicar…

Leia mais

Dicas

Como criar um fluxo de RAG utilizando 100% os recursos do Databricks

Dicas 16/05/2025Por Airton Lira Junior17 minutos de leitura

Todo engenheiro de dados (Data Engineer) e desenvolver de software (Software Engineer) está ou vai estar muito “Harmonizado” e na minha visão deve estar engajado com o desenvolvimento de soluções de AI. Ok tudo bem, neste artigo vou mirar mais no meu publico que são os Data Analytics Engineer, Data Architech, Data Engineer, DBRE etc.. mas você desenvolvedor vai precisar saber disso também, mas por que então vou escrever esse artigo mais para o publico de Data, bom por que aqui no Brasil o Databricks é massivamente utilizado para questões de Data e não desenvolvimento de software, contudo o conceito…

Leia mais

Dicas

Criando multiagentes de AI de forma simples

Dicas 11/05/2025Por Airton Lira Junior5 minutos de leitura

Opa, pessoal! Espero que todos estejam bem. Estou iniciando aqui uma série de artigos que vou escrever desde o mais básico até o mais avançado sobre o mundo da Inteligência Artificial (AI). Atualmente, no momento em que escrevo este artigo, não atuo mais diretamente com AI, mas é o meu PDI (Plano de Desenvolvimento Individual), ou seja, algo que estudo porque sei que será o futuro. Portanto, neste artigo, vou te ensinar a desenvolver não apenas um chatbot simples (pois isso já não vale mais nada no mercado), mas sim três agentes de AI utilizando o framework LangChain e Python.…

Leia mais

Dicas

Datavault com minIO, Delta e Spark no jupyter notebook

Dicas 07/05/2025Por Airton Lira Junior9 minutos de leitura

E aí, pessoal! Estou super animado para compartilhar minha experiência construindo uma arquitetura Data Vault usando tecnologias modernas de Big Data. Se você, assim como eu, está querendo entender como implementar Data Vault na prática (e não apenas na teoria), este artigo é para você! Vamos mergulhar nesse projeto incrível que combina Apache Spark, Delta Lake, Minio e Docker. É coloquei o minIO para deixar diferenciado a coisa e como foi difícil configurar no jupyter notebook para o spark session afff, mas deu bom 😎 O que vamos explorar? Bora lá? Introdução: Data Vault e o Problema que Resolvemos Antes…

Leia mais

Dicas

Feature Engineering para Embeddings com SparkML e MLFlow no Databricks Experiments

Dicas 05/05/2025Por Airton Lira Junior5 minutos de leitura

Hoje resolvi relembrar alguns conceitos de machine learning e entre eles a parte de vetorização de categorias para ter um dataset mais apto para deep learning (Redes neurais). Portanto neste artigo vou demonstrar de forma pura como utilizar a lib do spark de machine learning e criar o experimento ou seja a pipeline no MLFlow dentro do Databricks. Escolhendo um dataset adequado: Para este artigo vou utilizar um dataset publico do Kaggle chamado parking transaction que é um dataset em csv que contém registros de transações de estacionamento de várias fontes, incluindo medidores de estacionamento e aplicativos de pagamento móveis.…

Leia mais

Colunistas

Micro serviços em Go com Prometheus utilizando Rabbitmq e Postgresql

Colunistas 10/02/2025Por Airton Lira Junior22 minutos de leitura

Nas minhas aventuras de estudo na linguagem Go me deparei com a vontade de trabalhar com micro serviços com a linguagem Go visto que é uma linguagem muito divertida,simples e performática. Ao longo dos estudos conheci o software aberto Prometheus que gerencia muito bem a parte de métricas e gerenciamento de alertas no cenário de micro serviços, trabalhei um pouco também com o RabbitMQ nos diversos tipos de exchange para aprender na prática o comportamento de cada uma e a utilização no cenário de micro serviços para comunicação entre os mesmos através de um sistema de mensageria. Pensei também em…

Leia mais

Colunistas

Criando um Service Principal para acesso ao SQL Warehouses Databricks via DBeaver

Colunistas 02/02/2025Por Airton Lira Junior4 minutos de leitura

Neste artigo vou ensinar como se conectar a um cluster serverless do SQL Warehouse do Databricks utilizando as credenciais de um SP – Service Principal do Databricks. Atualmente, não encontrei nenhum tutorial fácil de como fazer isso e tive que fazer um descompile do arquivo JAR do driver de conexão do Databricks para entender se é possível ou não, visto que, na documentação oficial do Databricks, não fica claro se utilizando o clientId, clientSecret e token é possível se conectar pelo DBeaver. O caminho mais direto e fácil foi via PAT – Personal Access Token. Portanto, agora vou demonstrar como…

Leia mais

Autor: Airton Lira Junior

Ciclos de Similaridade Web: Como Identificar Padrões e Rupturas na Era dos Dados

Séries temporais e seus componentes, aplicando ARIMA para forecast em dados do COVID-19.

Como criar um fluxo de RAG utilizando 100% os recursos do Databricks

Criando multiagentes de AI de forma simples

Datavault com minIO, Delta e Spark no jupyter notebook

Feature Engineering para Embeddings com SparkML e MLFlow no Databricks Experiments

Micro serviços em Go com Prometheus utilizando Rabbitmq e Postgresql

Criando um Service Principal para acesso ao SQL Warehouses Databricks via DBeaver

Nvidia anuncia novos modelos e ferramentas de IA abertas para pesquisa autônoma

OpenAI e Perplexity anunciam recursos de compras com IA provocando Google e Bing

Tecnologia desenvolvida na UFPB permite reutilização de baterias de veículos eletrificados

Gemini 3 Pro cria superfície de ataque profunda e invisível

Últimas Noticias

Empresa reguladora de JPMorgan Chase, Citi Bank e Morgan Stanley declara ter sofrido ataque cibernético

Nvidia anuncia novos modelos e ferramentas de IA abertas para pesquisa autônoma

OpenAI e Perplexity anunciam recursos de compras com IA provocando Google e Bing