O intuito desse projeto junto à Dio e NTT Data foi a criação de uma instância na Azure para MySQL, criação do banco de dados com base no script fornecido, integrar o Power BI com o MySQL no Azure e por fim verificar problemas na base de dados a fim de realizar a transformação desses dados.
- passo 1: configuração do Azure
- passo 2: Popular servidor com script fornecido
- passo 3: Integrar MySQL com Power BI
- passo 4: Realizado o passo Transformação do ETL
Fluxo mostra como será o passo a passo para o projeto, além de que será necessário desenhar um relatório do passo a passo do processo.
Primeiramente todos trabalho será realizado em uma base de dados de teste. Em seguida será criado um relatório para verificar as informações.
- Criar instancia na Azure MySQL
- Criar banco de dados com dados disponiveis no git Hub
- Integrar PowerBi com MySQL
- Verificar problemas na Transformação
-
Verificar cabeçalhos e tipos de dados
-
Modificar valores monetários para tipos double
-
Verificar valores Nulos e análise para remoção
-
Os Employer com nulos em Super_snn podem ser gerentes verficiar se existe algum colaborador sem gerentes
-
verificar se existe departamentos sem gerentes
-
se houver departamento sem gerente, suponha que tenho dados e preencher lacunas
-
verificar se existe numero de horas de projetos
-
separar colunas complexas
-
mesclar consultas employee e departamento para criar uma tabela employee com nome dos departamentos associados aos colaboradores. A mescla terá como base a tabela employee.
-
OBS: Fique atento, essa informação influencia no tipo de junção.
-
Neste processo elimine as colunas desnecessárias
-
Realizar a junção dos colaborador e respectivos nomes dos gerentes isso pode ser feito com consulta SQL ou pela mescla de tabelas com POWER BI caso utilize SQL, especifique no README a query utilizada no processo.
-
Mesclar as colunas de nome e sobrenome para ter apenas uma coluna definindo os nomes dos colaboradores.
-modificação dos valores monetários para o tipo double preciso
-Todos departamentos tem gerentes:
-número de horas do projeto:
-mescla colaboraddores e nome dos gerentes:
-mescla nome e sobrenome:
-mescla nome de departamento e localização:
-exibição do modelo:
-
Neste caso, onde você tem dados de "Gerente" e "Colaborador" ou "Store" e "December", utilizar o recurso mesclar é mais apropriado do que atribuir. O motivo é que, ao mesclar consultas no Power BI, você está combinando dados de diferentes tabelas com base em uma chave ou coluna comum, mantendo a relação entre elas. Isso possibilita a criação de novas colunas combinando dados de várias tabelas.
-
Já o ato de atribuir seria mais usado para modificar ou renomear colunas e valores dentro de uma única tabela, não agregando informações de múltiplas fontes. Como o objetivo aqui parece ser unir e agregar dados de diferentes conjuntos, a mesclagem é a abordagem correta, preservando as referências cruzadas entre as tabelas.