Tl;dr: Hubo una interrupción del servicio y eso provocó que todos los discos se corrompieran. Ya está todo arreglado.
Hola!
Como algunos habrán notado, el 5 de julio hubo una caída en el sitio de Feddit.cl. Revisando, me encontré con que el proveedor de la VPS (Vultr) decía que existían problemas de conectividad en el sitio.
Esto ya había pasado anteriormente y solo hubo que esperar, pero el día domingo, al volver a funcionar la VPS, el sitio no estaba disponible y pude notar desde la consola de Vultr que había un error al iniciar.
Al poder estar ya en un pc normal en la noche, pude recuperar una imagen anterior del disco del sistema e iniciar la vps con lo que pude ver que los dos discos externos (con las bases de postgres y de pictrs).
Revisando los discos estos no podían ser montados, fsck y otras herramientas me decían que no podía reparar nada y en internet solo leía como estaba todo perdido y tenía que dar el disco por muerto. Hasta que me topé con ddrescue que me permitió copiar los discos malos a otros con toda la información que tenían adentro, o esa era la idea pero este procedimiento solo funcionó con el disco de Pictrs, no con el de Postgres, el cual era el más valioso.
Como paréntesis, mientras se copiaban los discos con ddrescue, levanté una instancia free tier de Amazon para poder levantar status.feddit.cl (gracias a skrlet13 por levantar uno también, pero quería dejar mensajitos) y también un sitio de error de Feddit para cuando las cosas se ponen feas (como este finde) y poder redirigirlos a un lemmy mirando un notebook.
Volviendo al evento, buscando como poder acceder a un disco copiado pero no particionado por ddrescue, me topé con testdisk, herramienta para recuperación de datos bien variada, con la cual pude constatar que el disco de postgres tenía información. Copié todo a un nuevo disco, inicie el docker y por suerte todo cargó.
Después de esto, aprendí harto sobre recuperación de discos, Vultr no me cae tan bién y levantó las alertas para tener el respaldo, de por lo menos postgres, para que estos eventos no ocurran con tantos problemas.
¡Lo siento por la espera!
Muchas palabras de waton informático, mejor dime a quién hay que pegarle
Gracias por tu trabajo Fean
A mi 😳
Gracias, tío Feanie! Se aprecia el trabajo que ud dedica a este sitio y comunidad. Que tenga buena semana.
Lo mejor de esto fue el lemmy bonito.
Administrar una instancia, dijeron.
Será divertido, dijeron.
Me entretienen esas cosas, termino aprendiendo caleta jajaja
Lo malo es que les dejé el sitio tirado por días ):
No pasa ná. Se entiende. Nosotros agradecidos por tu servicio y permitir la existencia de esta hermosa comunidad.
gracias don pudutr0n 😘
yo no se naa de IT, pero sería bkn que pensaras la posibilidad de conseguir un par de manos extras para que no seas solo tú en el proyecto, suena caleta de pega mantener una instancia.
Gracias por tanto, perdón por tan poco
Gracias por el esfuerzo y hacer todo esto posible guachito
Muacks
se agradece el trabajo tio fean
Muchas gracias por mantener el sitio a flote y la explicación, se agradece mucho el esfuerzo en mantener todo funcionando. No importa el retraso, es tu tiempo libre.
La verdad este finde parecía angustiado cargando feddit (especialmente porque esta semana que pasó no pude revisar mucho), pero encontré otras cosas en qué ocuparme.
Se agradece mucho todo tu esfuerzo para mantener el sitio, Feandoe.
Adyacente:
¿Quién hizo el monito lindo mirando el notebook? Se ve bonito y tengo interés en buscar eventualmente un artista -ojalá chileno o latino- que haga diseños simplecitos.
Yo lo hice en el celu.
Estoy lejos de ser un artista eso sí.
Igual es bonito uwu.
Así deberia informar el metro cuando pasa cositas. Larga vida al hamster
tio una duda, por que razón el old tiene más uptime que el normal?
Porque le eché a andar el monitor después (cuando ya estaba arriba el sitio) y el % de uptime es en las últimas 24 hrs.
deleted by creator
deleted by creator
deleted by creator
aaaaaaaaaaaaaaah
con razon, bueno al menos se ve que el old es un poquito mas estable(ahorita mientras escribo), pero iwal está a la merced del core de lemmy
xd justo cuando comento esto lemmy se muere
al menos no me dio error 500
👍👍 Gracias por su trabajo don Fean igual
Gracias