Modelo de Arquitetura para Sistema de Médio Porte

28 de dezembro de 2016 26 respostas

Caue_Carvalho 28 de dezembro de 2016

Boa Noite pessoal!

Andei pesquisando bastantes nessas ultimas semana a respeito de arquitetura de sistemas, mas ainda estou com algumas dúvidas e por isso estou recorrendo ao GUJ.

Estou iniciando um projeto de médio porte, onde ocorrerão muitos acessos a informações contidas em banco de dados, este que atualmente esta com aproximadamente 10Gb de informação, e ele tende a crescer quando eu importar algumas informações referentes a dados de funcionários.

Minha dúvida é a seguinte, qual seria a melhor forma de tratar os acessos ao banco (selects, inserts, updates e deletes) dentro do sistema, não em momentos de cadastros, pois nestes casos as DAOs resolvem, mas sim nos processos do sistemas, tais como importações de arquivos, cálculos estatísticos, criação de estrategias e por fim geração de um PPT que está parametrizado na base de dados,

No caso descrito acima, não vejo DAOs como a melhor solução, pois nem sempre precisarei de todos os dados de um objeto, e na maioria dos casos serão selects com alguns JOINS.

Pensei em usar algo semelhante ao que usamos na empresa em que trabalho, mas com algumas melhorias de OO, pois o sistema em que trabalho hoje é um sistema desenvolvido em Delphi lá pelos anos 2000, mas temos casos muito parecidos, tais com cálculo de folha de uma empresa, e o fechamento de competencia, que são ações que demandam muitos acessos ao banco, e lá nas classes de negócio, por diversas vezes fazemos os acessos ao BD por elas.

Alguém tem alguma sugestão de como eu poderia seguir?

Obrigado!!

26 Respostas

fnx 28 de dez. de 2016

Os seus DAO’s não necessariamente trabalham para operações CRUD.

Com o Hibernate, por exemplo, você pode customizar o retorno de uma consulta ao banco de dados, de forma que uma classe específica receba todos os campos resultantes de sua consulta customizada (JOIN que traz campos de duas tabelas, por exemplo).

Referente aos SQL’s (QLs no caso da JPA), podem ser centralizados em algum arquivo .properties, por exemplo. Você também pode fazer esta customização com @NamedQueries, especificando a classe de retorno customizada em cada @NamedQuery. Enfim, o importante é ter em mente que as consultas podem ser customizadas como queira.

Espero ter ajudado! ^^

Caue_Carvalho 28 de dez. de 2016

Eu montei um pedaço da infraestrutura e estou usando o Hibernate com as Native Querys, com essa parte estou até que tranquilo, o que me gera mais dúvida é a questão das diversas alterações na base que vão ocorrer.
Vou pegar com exemplo o processo de fechamento de uma folha de pagamento.

Temo neste caso o calculo dos valores a serem pagos/descontados, até ai de maneira geral são selects dos valores e select da rotina de cálculo que foi parametrizada, entretanto esse calculo ocorre para algumas centenas de funcionários, e após os cálculos, temos gravação de log, atualização do cadastro do funcionário, pois pode ter ocorrido a programação de alguma alteração, replica dos dados antes da atualização para manter histórico, gravação dos valores apurados no cálculo em tabelas de resultados e por fim emissão de relatórios.

No caso acima iniciamos uma transação para cada funcionário e ao final realizamos o commit ou o rollback caso tenha ocorrido algum erro.

Nesta situação, as DAO’s fariam esse controle de transação?

Ah, já ajudou um pouco sim…

peczenyj 28 de dez. de 2016

o dao tem a capacidade de abstrair o banco de dados. é util para desacoplar o seu programa da infraestrutura.

ele não vai fazer apenas controle de transações. se vc precisar de cache, é nesse cara que vai trabalhar (usando hibernate também).

banco de dados é um detalhe da sua aplicação. a logica de calcular uma folha de pagamentes é a mesma se os dados vem de um arquivo ou de 50 tabelas ( o salario sera o mesmo ).

é claro que o seu sistema não é totalmente desacoplado com a fonte de dados, vc vai ter que fazer algo, seja produzir log ou mesmo gravar no banco de volta quanto ja foi pago ( chute meu isso ).

nesse caso vc não precisa misturar o codigo com INSERT/ DELETE / UPDATE. vc deixa isso pro DAO.

uma outra vantagem são os testes unitarios: vc pode injetar um DAO ( um mock/stub ) que pode lançar exceptions ou que retorna determinados valores e vc pode verificar todos os fluxos ( cobertura ) do seu codigo.

por fim, se um dia vc mudar de banco/alterar colunas/etc, vc muda o DAO.

eu realmente não entendo pq vc gostaria de trabalhar sem uma abstração dessas ( pode usar Repositorios/DDD no lugar) a menos que o seu problema seja performance (e ainda assim isso é discutivel pois o overhead que vc tem é apenas uma indireção, uma chamada de metodo, se vc comparar com um profiler vai ver que o ganho sera de micro-segundos ).

se vc tem problemas de performance e o calculo de folha de pagamentos é algo paralelizavel e independente (o salario de A depende de algo em B?), eu tentaria escalar processando varios empregados ao mesmo tempo em threads diferentes ou usando algum tipo de job scheduler.

eis uma vantagem dos testes unitarios: vc pode garantir que a logica funciona em todos os casos previstos na especificação. se vc precisa executar em paralelo isso vai ser relativamente mais complexo de testar ( por conta de nem sempre ser possivel prever a ordem das threads, por exemplo ) porem vc só precisa garantir que uma dada quantidade de dados foi processada e com sucesso ( ou seja vc não esqueceu ninguem ).

Pra mim o seu modelo deveria justamente trabalhar com estas questões relevantes. quanto tempo vc vai levar pra computar uma folha de pagamento? vc pode computar em paralelo? como a performance do banco de dados influencia? como vc gera o relatorio? pode gerar o relatorio parcial? como vc monitora que esta indo tudo bem? como vc grava o log? vc espera calcular isso em um dia? qual o maximo? quantos usuarios? pode usar cloud computing? vc pode/deve marcar um dado usuario como urgente e processar ele primeiro? etc.

percebe que algumas perguntas podem não fazer sentido, não conheço o problema. mas se performance não é um problema então foco em calcular correto pq com o salario das pessoas não se brinca.

Caue_Carvalho 28 de dez. de 2016

Esse foi o maior motivo de deu abrir o tópico aqui no GUJ, não quero trabalhar sem essa abstração, pois o sistema de folha em que trabalho hoje, eu por vezes considero o código extremamente bagunçado. Mas como estou na empresa já tem um tempo (e o framework do sistema foi desenvolvido internamente no inicio dos anos 2000, praticamente não existem padrões de projeto, apenas OO mesmo), ainda estou com um pouco de dificuldade para algumas coisas que eu sei que eu deveria saber…rsrsrs

Com relação a folha de pagamento, dei como exemplo por ser o mercado que trabalho a 6 anos, e por realmente ter bastante INSERT, SELEC e UPDATE durante um processamento, e este que normalmente fica em execução por volta de 8 horas em uma empresa com uns 35 mil funcionários. Mas o meu projeto atuará na área da saúde, com algumas situações muito parecidas com o que ocorre na Folha.

Com relação ao controle de transações por meio da DAO, deixaria a própria DAO recuperar uma session do Hibernate?

Faria sentido eu criar uma DAO genérica onde ela saiba fazer o DML básico, e quando instanciar ela dentro de um processo, eu passar os comandos que eu quero que ela execute, estes armazenados em um arquivo .properties? OU o melhor seria fazer uma DAO para cada tipo de processo que possa existir, no exemplo de folha, uma para cálculo de férias, outra para rescisão contrataual e por ai vai.

Eu sei que algumas perguntas são de temas triviais, mas realmente ainda está um pouco nebuloso para mim.

peczenyj 28 de dez. de 2016

nada impede que vc tenha um DAO generico ( abstract ) e DAO especificos.

porem se vc tem muita logica, vc não vai construir DAO para cada tipo de processo. vc provavelmente vai criar abstrações que sabem calcular cada tipo de processo e estes vão usar os DAOs.

vc pode dar o nome de Serviço se fizer sentido. este Serviço vai saber ler o que fazer de algum lugar ( que pode ser um .properties, um json, um javascript, etc ).

existem varios patterns pra fazer isso.

Caue_Carvalho 28 de dez. de 2016

Seria algo parecido com isso:

Tenho uma DAO que sabe fazer o DML (Independente de qual texto tenha o comando), na minha classe de processo digo: DAO inicie a transação, execute esse comando com estes parâmetros, se deu tudo certo faz o commit.

Seria algo como se as DAO’s fossem um objeto Query.

Claro que isso de uma maneira bem hipotética.

javaflex 30 de dez. de 2016

Os processos do sistema que você se refere podem ficar nas classes de negócio, cada classe será responsável por uma funcionalidade específica. Na minha opinião não precisa se complicar com uma arquitetura mirabolante, importante é ser organizado e a equipe coesa. Outra coisa importante é não fazer um “sistemão”, mas dividir em módulos para cada grupo de usuário. Se a aplicação usa banco de dados relacional, então escrever SQL vai fazer parte da codificação da regra de negócio. Mecanismo genérico só vai te engessar para esses “processos” do sistema.

pfk66 30 de dez. de 2016

não é só configurar a unidade de persistência no xml e pronto?

Eu achava que hibernate e afins era usado justamente pra evitar que o desenvolvedor da aplicação de folha de pagamentos precisasse tratar qualquer coisa relacionado à acesso ao banco no código.

mas eu tb não sabia que era comum usar DAO com ORM, pra mim não faz muito sentido.

Talvez eu esteja apenas por fora do mundo Java mesmo!

Você sequer precisa de um objeto na maioria das vezes. Calcular a folha de pagamento nada mais é do que uma função (ou procedure) do estado atual do banco.

pfk66 30 de dez. de 2016

Calcular os valores a serem pagos/descontados e emissão de relatórios não é processo, e sim percepção. Todo o resto é processo porque causam alguma mudança no sistema, mas são processos que não precisam ser coordenados entre si pois são sempre executados após uma nova gravação na tabela de resultados, e portanto não precisam fazer parte da transação.

pfk66 30 de dez. de 2016

Mas é apenas complexidade desnecessária vazando da camada de infraestrutura né, não tem nada a ver com o negócio?

Caue_Carvalho 30 de dez. de 2016

Realmente alguns não precisam fazer parte de transação, mas a minha dúvida maior é como tratar o isolamento da camada de acesso ao banco, pois como eu citei mais acima, não consigo entender como utilizar o padrão DAO nestes casos.

Quando eu estava na faculdade sempre foram mostrados exemplos do padrão DAO com cadastros simples, e realmente fica muito simples de visualizar, mas nunca encontrei um exemplo (mesmo na faculdade) do padrão sendo aplicado em outros casos, tais como apuração de valores (pois realizam selects), importação de arquivos (que realizam selects e inserts), e nestas ações não serias feitos apenas selects que representam um objeto do modelo.

javaflex 30 de dez. de 2016

Não entendi o que você quis dizer, mas falei sobre complexidade técnica desnecessária. Percebo que a geração atual se preocupa mais com siglas do que atender o negócio.

pfk66 1 de jan. de 2017

Já que vc falou que precisa manter historico, de uma olhada em Datomic.

Sim, muitos padrões OO só funcionam em situações simples e exemplos de faculdade mesmo.

Frameworks como Hibernate, tb tem suas limitações em sistemas reais.

Por exemplo, você não pode criar queries mais complexas a partir de queries mais simples. Como já foi falado, vc pode customizar, mas não compor. Composição é uma das abstrações mais poderosas (imagina não poder criar uma lista a partir de outra lista), mas um desenvolvedor Hibernate não pode compor queries.

Outro problema dessas ferramentas é a performance. O cache local, que em tese, deveria evitar idas ao banco, não é muito útil com dados mutáveis. Se as informações do banco mudam com frequência, o cache vai estar desatualizado na maioria das vezes, e vc acaba tendo que ir ao banco de qualquer maneira.

Datomic vc pode compor queries (queries são estruturas de dados e não strings) então não tem esse problema. E como em Datomic vc trabalha com dados imutáveis, o cache local funciona que é uma beleza.

pfk66 1 de jan. de 2017 1 like

Estou dizendo que idealmente, as classes do pacote negócio deveriam conter aspectos do negócio (folha, ferias, rescisão), e não mapeamento O/R e DAOs.

javaflex 1 de jan. de 2017

Com certeza.

Caue_Carvalho 1 de jan. de 2017

Vou dar uma olhada sim.

Acredito que isso seja um pouco da resposta da minha dúvida inicial, em dado momento não vou escapar de criar uma classe que acabe mesmo que indiretamente chamando a execução de um comando mais elaborado.

Saindo um pouco do tema de acesso a banco.

Para framework, estava pensando em usar o Spring (MVC), andei lendo um pouco e ele me agradou, não me pareceu tirar performance do sistema, consigo além de retornar as páginas, também consigo retornar um JSON (ótimo para disponibilizar um acesso para outro sistema por meio de REST), e me permite usar o Angular ou o Ext Js na camada de front-end (o Ext foi um pensamento apenas porque o utilizo diariamente na empresa).

Acabei caindo para o lado do Spring devido as opiniões dadas em diversos tópicos na internet.

Mas não custando perguntar, Soring seria uma boa?

javaflex 2 de jan. de 2017

Por mais que seja uma ferramenta engessada para “sistemas reais”, a maioria na comunidade Java e até mesmo .NET infelizmente seguem a doutrina que ORM deva ser usado para seguir padrões OO e de forma mais uniformizada, não importando se o cara vai gastar um dia inteiro tirando leite de pedra da ferramenta para gerar algo fora do trivial, que seria muito mais prático de escrever diretamente via SQL no caso de banco relacional. Fora que Hibernate é um peso inútil para aplicações HTTP, onde recursos como Lazy não trazem nenhum benefício para atender a funcionalidade, pelo contrário, só degradam performance com n+1 querys. E cache no servidor web é algo bem questionável, para client desktop ok. Multibanco é uma das poucas utilidades que o Hibernate proporciona, claro que quando isso for realmente necessário.

pfk66 2 de jan. de 2017

Muitas empresas usam Java e .NET mas todo o negócio mesmo roda no banco de dados.

Como somente o resultado é disponibilizado para aplicações escritas nessas linguagens, pra quem está de fora, fica parecendo que todo o sistema é em Java ou .NET, mas na verdade é só o CRUD.

Sendo sistemas internos, sem muito acesso, hibernate parece ser um bom compromisso.

pfk66 2 de jan. de 2017

Você pode usar tanto servidor de aplicação, spring ou até mesmo um fat JAR com todas as dependências incluídas pra ser executado diretamente com o comando Java -jar sistema.jar.

Caue_Carvalho 2 de jan. de 2017

A questão do FAT me agrada, vi alguns exemplos e realmente me parece muito bom, principalmente no sentido de empacotar o Web Server no JAR

javaflex:

Por mais que seja uma ferramenta engessada para “sistemas reais”, a maioria na comunidade Java e até mesmo .NET infelizmente seguem a doutrina que ORM deva ser usado para seguir padrões OO e de forma mais uniformizada, não importando se o cara vai gastar um dia inteiro tirando leite de pedra da ferramenta para gerar algo fora do trivial, que seria muito mais prático de escrever diretamente via SQL no caso de banco relacional. Fora que Hibernate é um peso inútil para aplicações HTTP, onde recursos como Lazy não trazem nenhum benefício para atender a funcionalidade, pelo contrário, só degradam performance com n+1 querys. E cache no servidor web é algo bem questionável, para client desktop ok. Multibanco é uma das poucas utilidades que o Hibernate proporciona, claro que quando isso for realmente necessário.

Eu realmente tenho essa preocupação, tanto que estou pensando em deixar o Hibernate com as sua funcionalidade principais apenas nos cadastros em em algum ponto ou outro (ainda discutível), mas no resto do sistema utilizar as StatelesSession, somente para facilitar.

peczenyj 2 de jan. de 2017 1 like

isso e uma falacia.

se o hibernate é um gargalo, isso vai aparecer se vc executar um teste de performance + um profiler decente. e ai vc configura o mesmo decentemente. se Lazy não é beneficio então basta não usar.

acessar um banco de dados é uma forma de I/O e temos um delay devido a natureza do mecanismo de transporte pela rede, fora toda a questão de replicação, queries paralelas, dados normalizados, etc.

dificilmente o problema é o hibernate em si. muito provavelmente é a arquitetura decidida por um comitê que não foi desenhada para performance em algumas operações, o que é bem comum quando o povo desenha o banco de dados primeiro e a camada web passa a ser um “detalhe” ( e tem aquela famigerada sessão de “cadastros basicos” ou “vamos inventar como cadastrar pessoa fisica e juridica de uma forma diferente dessa vez”).

meu testemunho: Hibernate em Dynamic Creative Optimization tendo que responder milhares (worst case) de requests por segundo muito rapido (ou a propaganda não aparecia, e ninguem recebia $), eu acho que o problema não na ferramenta - e sim de não saber configurar ou usar. ah eu tinha umas partes Lazy também. detalhe que nós tinhamos monitoria em tempo real e rolava alerta quando algo demorava demais - muitos sistemas, principalmente corporativos, não tem nada disso.

eu lembro de um caso de uma operadora de telefonia onde uma parte do site redirecionava pra uma outra parte ( de pagamentos ) e frequentemente dava algum erro ( estilo interno 500 ) na cara do cliente. ai as duas equipes iam conversar e a outra parte não sabia lhufas do que acontecia ( mas negava os problemas ). chegaram ao ponto de alguem simular centenas de pagamentos em um dia pra fazer uma estatistica e tirar print screen de cada erro - e ainda assim a outra parte negava qualquer incidente E virou um problema politico.

minha visão é que existe toda uma classe de sistemas web desenhadas de forma muito ruim, imitando algo que deu certo na decada passada e que não se atualizou pro século XXI por falta de conhecimento e dominio do idioma inglês - quando não rola um overengineering/BDUF (nesse cenario talvez o proprio uso de java poderia ser questionado), e isso é diretamente relacionado aos interesses financeiros por tras do projeto.

agora culpar o Hibernate ou qualquer outra biblioteca é ridiculo - tem quem tenha desenvolvido o proprio driver de banco de dados por que ISSO q era o gargalo (e eu inclusive ja fiz isso, mas em outro contexto que não java).

eu ate diria mais: o programador web medio não tem experiencia com performance pois ele nem sempre precisa - vide a galera que salva imagem em banco de dados.

meus dois centavos

pfk66 2 de jan. de 2017

Mas o público alvo do Hibernate é esse. Claro, um programador com experiência em performance de banco de dados pode fazer miséria com Hibernate, assim como pode fazer com stored procedures, mas não é pra eles que a ferramenta foi criada, e sim para desenvolvedores de aplicações front-end que não deveriam precisar saber sobre performance de banco de dados.

javaflex 2 de jan. de 2017

peczenyj:

javaflex:

Fora que Hibernate é um peso inútil para aplicações HTTP

isso e uma falacia.

se o hibernate é um gargalo, isso vai aparecer se vc executar um teste de performance + um profiler decente. e ai vc configura o mesmo decentemente. se Lazy não é beneficio então basta não usar.

acessar um banco de dados é uma forma de I/O e temos um delay devido a natureza do mecanismo de transporte pela rede, fora toda a questão de replicação, queries paralelas, dados normalizados, etc.

dificilmente o problema é o hibernate em si. muito provavelmente é a arquitetura decidida por um comitê que não foi desenhada para performance em algumas operações, o que é bem comum quando o povo desenha o banco de dados primeiro e a camada web passa a ser um “detalhe” ( e tem aquela famigerada sessão de “cadastros basicos” ou “vamos inventar como cadastrar pessoa fisica e juridica de uma forma diferente dessa vez”).

meu testemunho: Hibernate em Dynamic Creative Optimization tendo que responder milhares (worst case) de requests por segundo muito rapido (ou a propaganda não aparecia, e ninguem recebia $), eu acho que o problema não na ferramenta - e sim de não saber configurar ou usar. ah eu tinha umas partes Lazy também. detalhe que nós tinhamos monitoria em tempo real e rolava alerta quando algo demorava demais - muitos sistemas, principalmente corporativos, não tem nada disso.

eu lembro de um caso de uma operadora de telefonia onde uma parte do site redirecionava pra uma outra parte ( de pagamentos ) e frequentemente dava algum erro ( estilo interno 500 ) na cara do cliente. ai as duas equipes iam conversar e a outra parte não sabia lhufas do que acontecia ( mas negava os problemas ). chegaram ao ponto de alguem simular centenas de pagamentos em um dia pra fazer uma estatistica e tirar print screen de cada erro - e ainda assim a outra parte negava qualquer incidente E virou um problema politico.

minha visão é que existe toda uma classe de sistemas web desenhadas de forma muito ruim, imitando algo que deu certo na decada passada e que não se atualizou pro século XXI por falta de conhecimento e dominio do idioma inglês - quando não rola um overengineering/BDUF (nesse cenario talvez o proprio uso de java poderia ser questionado), e isso é diretamente relacionado aos interesses financeiros por tras do projeto.

agora culpar o Hibernate ou qualquer outra biblioteca é ridiculo - tem quem tenha desenvolvido o proprio driver de banco de dados por que ISSO q era o gargalo (e eu inclusive ja fiz isso, mas em outro contexto que não java).

eu ate diria mais: o programador web medio não tem experiencia com performance pois ele nem sempre precisa - vide a galera que salva imagem em banco de dados.

meus dois centavos

Numa aplicação HTTP para um banco de dados, é só nao usar lazy, nao usar session com cache, …, opa, pra quê o Hibernate está sendo usado então? Por opção pessoal para seguir modelagem OO? Quanto a isso ok, cada um com suas escolhas.

Caue_Carvalho 6 de jan. de 2017

Acho que com relação ao acesso a base está tranquilo.

Mas queria uma outra opinião de vocês, comecei a fazer a parte de infra estrutura, e para alguns processos do sistema, gostaria que eles continuassem em execução mesmo quando o usuário se desconectasse por qualquer motivo. Então criei uma lista com as Threads que estão cuidando do processo e um gerenciador que fica monitorando se o processo acabou e se já deu o tempo de TimeOut, para então limpar esse objeto da memória.

Vocês têm alguma sugestão com relação ao tema, ou a forma que coloquei está legal?

javaflex 7 de jan. de 2017

Só não entendi por que está se preocupando em criar gerenciador. Deixe mais claro qual tipo de aplicação está usando e o por quê deste gerenciador. Numa aplicação web, depois que a requisição for enviada para o servidor, o processo será realizado mesmo se o usuário perder a conexão. Lógico que deverá tratar a questão de usabilidade, para o usuário saber o que aconteceu depois, com operações assíncronas isso fica mais fácil.

Caue_Carvalho 7 de jan. de 2017

A aplicação é um projeto para a área da saúde, e para manter os dados do sistema, dependo de alguns arquivos que o governo disponibiliza, então precisarei importa-los em alguns momentos, e um deles possui 5 Gb de tamanho e um outro 2 Gb, fora eles, algumas tabelas do sistema também podem receber dados via importação (o que será mais comum), e dependendo do arquivo que estiver sendo importado, eu não preciso prender a utilização do sistema, então quero que uma thread separada faça esse processo, e o usuário tenha de imediato uma resposta de que a importação foi iniciada, e caso ele queira, poderá abrir a janela de monitoramento e com a barra de progresso. Caso ele não queira, a importação seguirá normalmente, mas quando ela finalizar (por erro ou não), a Thread da importação fica viva por algum tempo (configurável), e caso o tempo seja atingido, o gerenciador a mata. Além disso, caso alguma thread fique parada por algum motivo, ou esteja consumindo muito recurso, um administrador com maior acesso, pode entrar na tela desse gerenciador e matar a thread problemática, além de poder visualizar quais processos estão sendo executados pelos usuários.

Criado 28 de dezembro de 2016

Ultima resposta 7 de jan. de 2017

Respostas 26

Participantes 5

26 Respostas

Topicos relacionados