Jump to content

Recommended Posts

Posted

Bem pessoal antes de tudo sei que minha pergunta pode parecer "besteirinha" mas isso é uma coisa que deixa muito administrador e gerenciador de servidor dedicado com dados sensíveis  um pouco pensativo, a questão é quando reiniciar um servidor? e se existe alguma maneira de evitar a reinicialização de um servidor de forma 100%? todos sabemos que na teoria um servidor linux pode ficar ligado "pra sempre" mas em um ambiente de produção tudo pode mudar da noite para o dia ou de um minuto para o outro, hoje existem ferramentas como o kernel care que inclusive eu a utilizo que permitem o kernel atualizar sem o servidor precisar ser reiniciado, atualmente eu possuo 5 servidores dedicados 2 deles virtualizados todos tem as mesma características: processador  Dual Xeon E5-2670 com 32 núcleos, 64 GB de memoria RAM DDR3 e 1TB em disco SSD, com PLESK instalado e os  virtualizados com Virtualizador KVM, 2 deles estão ligados a mais de 400 dias e os outros com menos de 60 dias ligados e venho observando que os mesmos que estão ligados a mais de 400 dias vem perdendo o desempenho ao longo do tempo ou seja a qualidade e desempenho diminuiu um pouco, como hospedo dados ultra sensíveis evito a reinicialização do servidor pois uma vez tive o raro e tão temido e infeliz erro Kernel Panic e perdi um servidor inteiro, e como os servidores são usados para hospedagem de aplicações uma reinicialização poderia gerar dores de cabeça ou prejuizo como a morte de algum processo importante ou um processo inacabado no sistema  pois dia e noite 24 horas por dia existe algo sendo processado ou uma tarefa em execução. pois algumas das aplicações são globais.


Posted

@victor_develloper

Uma fatalidade vivida no passado não deve te levar a promover outra (postergando ações preditivas e preventivas - e a reinicialização do ambiente é uma delas). É isso que pode acontecer com a falta de manutenções planejadas. E sei bem da complexidade da coisa ao ponto de compreender o seu receio.

Eu poderia lançar uma série de perguntas levando você a questionar se o ambiente está ok na parte da manutenção lógica dos serviços, mas possivelmente você já deve ter satisfeito a todas.

Mesmo com o risco iminente do servidor entrar em modo de checagem do sistema de arquivos (por causa deste ótimo uptime), e demorar bem mais que o normal para voltar online por esta razão, eu faria a reinicialização.

- Comunique aos clientes desta manobra informando com vários dias de antecedência;
- Determine uma estratégia de backup onde o final do ciclo coincida com esta ação de reboot;
- Execute as checagens e otimizações e consulte os logs para tentar identificar o melhor momento para desligar os serviços;
- Efetive o reboot e esteja preparado para o pior. Isso será importante para que tudo ocorra bem.

 

Citar

Importante: É absurda a tentativa de um cliente em tentar jogar a responsabilidade de alta disponibilidade no fornecedor de infraestrutura. Os sistemas devem ser pensados e projetados para trabalhar em pontos distintos se desejarem minimizar chances de indisponibilidade. Por isso do aviso prévio de manutenções, para que o webmaster possa escalar isso e assegurar que as coisas do lado dele estão nos conformes.

 

Nos servidores que administro, e para os clientes que atendo, dou pouca ou nenhuma importância para o indicador de uptime do servidor (não menosprezo o uptime da rede, no entanto). Enfatizo que o negócio é não haver downtimes inesperados ou falhas na rede. Se for necessário reiniciar o servidor 4 vezes na semana em função de atualização de kernel ou outras questões de segurança e performance, faço sem qualquer receio.

 

Deixando a parte institucional de lado: Tenha backup. Também assegure que tenha backup do backup. Verifique constantemente o funcionamento do RAID 10 e suas variáveis. Mantenha os serviços internos atualizados (kernel é o menor dos problemas na maioria das vezes num servidor de hospedagem), e monitore os logs. E claro: não deixe de ter um contrato reservando o seu direito se passar por falhas e problemas técnicos. Afinal, nada é infalível.

 

Posted
20 minutos atrás, Eltern disse:

@victor_develloper

Uma fatalidade vivida no passado não deve te levar a promover outra (postergando ações preditivas e preventivas - e a reinicialização do ambiente é uma delas). É isso que pode acontecer com a falta de manutenções planejadas. E sei bem da complexidade da coisa ao ponto de compreender o seu receio.

Eu poderia lançar uma série de perguntas levando você a questionar se o ambiente está ok na parte da manutenção lógica dos serviços, mas possivelmente você já deve ter satisfeito a todas.

Mesmo com o risco iminente do servidor entrar em modo de checagem do sistema de arquivos (por causa deste ótimo uptime), e demorar bem mais que o normal para voltar online por esta razão, eu faria a reinicialização.

- Comunique aos clientes desta manobra informando com vários dias de antecedência;
- Determine uma estratégia de backup onde o final do ciclo coincida com esta ação de reboot;
- Execute as checagens e otimizações e consulte os logs para tentar identificar o melhor momento para desligar os serviços;
- Efetive o reboot e esteja preparado para o pior. Isso será importante para que tudo ocorra bem.

 

 

Nos servidores que administro, e para os clientes que atendo, dou pouca ou nenhuma importância para o indicador de uptime do servidor (não menosprezo o uptime da rede, no entanto). Enfatizo que o negócio é não haver downtimes inesperados ou falhas na rede. Se for necessário reiniciar o servidor 4 vezes na semana em função de atualização de kernel ou outras questões de segurança e performance, faço sem qualquer receio.

 

Deixando a parte institucional de lado: Tenha backup. Também assegure que tenha backup do backup. Verifique constantemente o funcionamento do RAID 10 e suas variáveis. Mantenha os serviços internos atualizados (kernel é o menor dos problemas na maioria das vezes num servidor de hospedagem), e monitore os logs. E claro: não deixe de ter um contrato reservando o seu direito se passar por falhas e problemas técnicos. Afinal, nada é infalível.

 

muito bons os pontos que você levou em consideração, então o meu medo principal é esse , a perda de dados. de qualquer forma irei ter que fazer esse reboot mas irei ser cauteloso totalmente vou planejar.

1 hora atrás, williantec disse:

É uma questão meio delicada de ser tomada, por isso muitas empresas de hospedagem nem se quer atualizam o painel delas, de medo do mesmo...

pois é, séria bom uma forma de não precisar reiniciar nunca...

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...

Important Information

Do you agree with our terms?

-